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CLONAGE, EXPRESSION ET CARACTERISATION DU GENE SPG4 
RESPONSABLE DE LA FORME LA PLUS FREQUENTE DE PARAPLEGIE 
SPASTIQUE AUTOSOMIQUE DOMINANTE. 

5 L'invention concerne (Identification et la caracterisation du gene SPG4 codant 

pour la spastin, responsable de la forme la plus frequente de paraplegie spastique 
familiale (PSF) autosomique dominante, le clonage et la caracterisation de son ADNc 
ainsi que les polypeptides correspondants. L'invention concerne Sgalement des 
vecteurs, des cellules transformees et des animaux transgSniques ainsi que des 

10 methodes de diagnostic et des nrtethodes de selection d'un compose chimique ou 
biochimique capable d'interagir directement ou indirectement avec un polypeptide 
selon l'invention. 

Les paraplegies spastiques familiales (PSF) sont des affections degeneratives 
du systeme nerveux central caracterisees par une spasticite bilaterale et progressive 

15 des membres inferieurs. Elles se manifested cliniquement par des difficultes de la 
marche pouvant 6voluer en une paralysie totale des deux jambes. La physiopathologi 
de cet ensemble de maladies est a ce jour peu documentee ; toutefois, les donn6es 
anatomopathologiques permettent de conclure que I'atteinte est limitee aux faisceaux 
pyramidaux responsables de la motricite volontaire dans la moelle epiniere (1). II existe 

20 differentes formes cliniques et genetiques de PSF. On distingue cliniquement les PSF 
dites « pures » correspondant a une spasticite isolee des membres inferieurs, d s PSF 
« complexes » pour lesquelles la spasticite des jambes est associde a d'autres 
manifestations cliniques de type neurologique ou non (2). D'un point de vue g§netique, 
les PSF peuvent etre transmises selon le mode autosomique dominant (PSF-AD), 

25 autosomique recessif (PS V F-AR) ou Ii6 au chromosome X (PSF-X). La forme « pure » 
de PSF qui est le plus souvent transmise selon le mode autosomique dominant 
demeure la plus frequente (environ 80 % des PSF) (1). L'incidence des PSF qui reste 
difficile a estimer en raison des rares etudes 6pidemiologiques et de I'importante 
variabilite clinique varie de 0,9 : 100 000 au Danernark, 3 a 9,6 : 100 000 dans 

30 certaines regions d'Espagne (4) ou 14 : 100 000 en Norvdge (5) (environ 3 : 100 000 
en France). 

En plus de cette grande variabilite clinique qui est observe non seulement 
entre les differentes families mais aussi entre differents membres atteints d'une meme 
famille, les PSF se caracterisent egalement par une importante h§terogen§ite 
35 g6n6tique. Dans le cas des PSF-AD, quatre I ci ont ete identifies a ce jour sur les 
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chromosomes 14 (locus SPG3) (6), 2 (locus SPG4) (7, 8), 15 (locus SPG6) (9) et 8 
(locus SPG8) (10). L'etude d'un grand nombre de families presentant une PSF-AD a 
montre que le gene porte par le chromosome 2 est un locus majoritaire de cette forme 
de la maladie, retrouv6 dans 40 a 50 % des families analysees (11, 12). Un 
5 phenomene d'anticipation a ete observe dans certaines families de PSF liee au locus 
SPG4 ; ce phenomene a par la suite ete associe a ('expansion d'une repetition (CAG)n 
mise en evidence dans 6 families danoises (13) par la technique de RED (pour Rapid 
Expansion Detection). Cette expansion n'a cependant jamais pu etre confirmee dans 
aucune des families testees par cette meme methode ni par la recherche systematique 

10 de sequences de type (CAG)n dans les cartes physiques composees de clon s YAC 
(pour Yeast Artificial Chromosome) ou BAC (pour Bacterial Artificial Chromosom ) 
(Hazan et al., sous presse dans Genomics). 

A ce jour, trois genes responsables de deux formes de PSF-X et d'une forme 
de PSF-AR ont ete identifies. Des mutations dans le gene, codant pour une molecule 

15 d'adherence cellulatre specrfique des neurones, L1-CAM (pour L1 Cell Adhesion 
Molecule), et localise en Xq28 (locus SPG1) causent une forme complexe de PSF (14) 
dans laquelle la spasticity est associee a un retard mental, alors que des mutations 
dans le gene PLP (pour ProteoLipid Protein) situe en Xq21 (locus SPG2), codant pour 
une molecule constitutive de la couche de myeline, sont d Torigine de formes pures et 

20 complexes de PSF-X (15). Plus recemment des mutations dans un gene localise en 
16q24.3 (locus SPG7), qui code pour la paraplegin, une ATPase mitochondriale de la 
famille proteique des AAA (pour «ATPases Associated with diverse cellular Activities*) 
(16) ont ete associees d des formes complexes et pures de PSF-AR (17), suggerant 
que des alterations de la phosphorylation oxydative (OXPHOS) peuvent etre d I'origine 

25 de PSF. 

Ainsi, il reste aujourd'hui un grand besoin dMdentifier et de caracteriser le gene 
responsable de la forme la plus frequente de PSF-AD. L'identification de ce gene 
devrait en particulier permettre, outre la possibility d'un test de depistage antenatal 
chez les families concemees, de mieux comprendre certains des mecanismes 
30 moleculaires engendrant ces deg6nerescences specifiques de faisceaux nerv ux de la 
moelle epiniere, voire d'apporter des elements de reponse quant d un trait ment 
therapeutique des malades. 

Ceci est justement I'objet de la presente invention. 

Apres avoir delimite I'intervalle de localisation ntre les marqueurs genetiques 
35 D2S352 et D2S2347 par Tetude des evenements de recombinaison dans les famill s 
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de PSF liees au locus SPG4, les inventeurs ont etabli un contig de BACs recouvrant 
une distance physique evaluee a environ 1 ,5 Mb et entrepris une strategie de clonage 
positionnel basee sur le sequencage de I'intervalle SPG4 afm d'identifier de facon 
exhaustive tous les genes localises dans la region candidate. L'analyse de la sequence 
5 des deux BACs, D (b336P14) et G (B763N4), a revele la presence d'un gene compose 
de 17 exons, s'etendant sur une distance d'environ 100 kb, et presentant une 
homologie avec les genes codant pour des proteines de la famille des AAA. La 
comparaison de la sequence de ce gene entre les individus sains et atteints des 
families de PSF-AD a permis de mettre en evidence differentes mutations chez les 
10 patients. 

L'invention a ainsi pour objet ('identification et la caracterisation du gene SPG4 
(ou SPAST) codant pour un nouveau membre nucleaire de la famille des AAA, 
responsable de la forme la plus frequente de PSF-AD. 

Sous un premier aspect, la presente invention a pour objet un acide nucleique 
15 purifie ou isole du gene SPG4, caracterise en ce qu'il comprend au moins 15 
nucleotides consecutifs, de preference 20, 25, 30, 50, 100 ou 200 nucleotides 
consecutifs, d'une sequence choisie parmi le groupe comprenant : 

- la sequence SEQ ID No. 1, sequence genomique du gene SPG4 humain ; 

- les sequences nucleiques homologues ou variantes de i'acide nucleique de sequence 
20 SEQ ID No. 1 ; 

- leur sequence complementaire ; et 

- la sequence de leur ARN correspondant. 

La presente invention conceme, bien entendu, aussi bien les sequences ADN 
qu'ARN ainsi que les sequences qui s'hybrident avec elles, de meme que les ADNs 

25 double brin correspondants. 

Par acide nucleique, sequence nucleique ou d'acide nucleique, polynucleotide, 
oligonucleotide, sequence de polynucleotide, sequence nucleotidique, termes qui 
seront employes indifferemment dans la presente description, on entendra designer 
aussi bien un ADN double brin, un ADN simple brin que des produits de transcription 

30 desdits ADNs, et/ou un fragment d'ARN, lesdits fragments naturels isoles, ou de 
synthese, comportant ou non des nucleotides non naturels, designant un 
enchainement precis de nucleotides, modifies ou non, permettant de definir un 
fragment ou une region d'un acide nucleique. On entend par fragment d'ADN et/ou 
d'ARN naturel isole, ou de synthese, comportant ou non des nucleotides non naturels, 
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un enchainement precis de nucleotides, modifies ou non t permettant de definir un 

fragment, un segment ou une region d'un acide nucleique. 

II doit etre compris que la presente invention ne concerne pas les sequences 

nucleotidiques genomiques dans leur environnement chromosomique naturel, c'est-a- 
5 dire a I'etat naturel. II s'agit de sequences qui ont ete isolees et/ou purifiees, c'est-a- 

dire qu'elles ont ete prelevees directement ou indirectement, par exemple par copie, 

leur environnement ayant ete au moins partieliement modifie. 

Par «sequence nucleique homologue» ( on entendra designer les sequences 

nucleiques presentant, par rapport a la sequence nucleique de reference certaines 
10 modifications comme en particulier une deletion, une troncation, un allongement, une 

fusion chimerique, et/ou une mutation, notamment ponctuelle, et dont la sequence 

nucleique presente au moins 80 %, de preference 90 % ou 95 %, d'identite apres 

alignement avec la sequence nucleique de reference. II s'agit de preference de 

sequences dont les sequences complementaires sont susceptibles de s'hybrider 
15 specifiquement avec une des sequences de I'invention. De preference, les conditions 

d'hybridation specifiques ou de forte stringence seront telles qu'elles assurent au 

moins 80 %, de preference 90 % ou 95 % d'identite apres alignement entre Tune des 

deux sequences et la sequence complementaire de I'autre. 

Une hybridation dans des conditions de forte stringence signifie que les 
20 conditions de temperature et de force ionique sont choisies de telle maniere qu'elles 

permettent le maintien de I'hybridation entre deux fragments d'ADN complementaires. 

A titre illustratif, des conditions de forte stringence de I'etape d'hybridation aux fins de 

definir les fragments polynucleotidiques decrits ci-dessus, sont avantageusement les 

suivantes : 

25 L'hybridation ADN-ADN ou ADN-ARN est realisee en deux etapes : (1) 

prehybridation a 42°C pendant 3 heures en tampon phosphate (20 rnM, pH 7,5) 
contenant 5 x SSC (1 x SSC correspond a une solution 0,15 M NaCI + 0,015 M citrate 
de sodium), 50 % de formamide, 7 % de sodium dodecyl sulfate (SDS), 10 x 
Denhardfs, 5 % de dextran sulfate et 1 % d'ADN de sperme de saumon ; (2) 

30 hybridation proprement dite pendant 20 heures a une temperature dependant d la 
taille de la sonde (i.e. : 42°C, pour une sonde de taille > 100 nucleotides) suivie de 2 
lavages de 20 minutes a 20°C en 2 x SSC + 2 % SDS, 1 lavage de 20 minutes a 20°C 
en 0,1 x SSC + 0,1 % SDS. Le dernier lavage est pratique en 0,1 x SSC +0,1 % SDS 
pendant 30 minutes a 60°C pour une sonde de taille > 100 nucleotides. Les conditions 

35 d'hybridation de forte stringence decrites ci-dessus pour un polynucleotide de taille 
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definie, seront adaptees par I'homme du metier pour des oligonucleotides de taille plus 
grande ou plus petite, selon I'enseignement de Sambrook et aL, 1989. 

Par resequence nucleique variante» ou «acide nucleique variant)) d'une 
sequence nucleique de reference, on entendra designer I'ensemble des sequences 
5 nucleiques correspondant a des variants alleliques, e'est-a-dire des variations 
individueiles de la sequence nucleique de reference. Ces sequences mutees naturelles 
correspondent a des polymorphismes presents chez les mammiferes, en particulier 
chez I'etre humain et, notamment, a des polymorphismes pouvant conduire a la 
survenue et/ou au developpement de pathologie. 

10 Si les sequences selon I'invention concement les sequences normales, elles 

concement egalement les sequences mutees dans la mesure ou elles comportent au 
moins une mutation ponctuelle et de preference au plus 10 % de mutations par rapport 
a la sequence normale. 

En particulier, les sequences nucleiques variantes comprendront toute 

15 sequence d'au moins 15 nucleotides consecutifs, de preference 20, 25, 30, 50, 100 ou 
200 nucleotides consecutifs, d'une sequence polymorphique de la sequence 
genomique du gene SPG4 humain de sequence SEQ ID No. 1, et dont la sequence 
d'acide nucleique presente par rapport a la sequence SEQ ID No. 1 au moins une 
mutation correspondant notamment a une troncation, deletion, substitution et/ou 

20 addition de residu d'acide amine. Dans le cas present, les sequences nucleiques 
variantes presentant au moins une mutation seront ici liees aux pathologies de type 
PSF-AD liees au locus SPG4. 

De preference, la presente invention concerne des sequences nucleiques 
mutees dans lesquelles les mutations conduisent a une modification de la sequence 

25 d'acides amines du polypeptide code par la sequence normale; 

On entendra egalement designer par sequences nucleiques variantes tout ARN 
ou ADNc resultant d'une mutation d'un site d'epissage de la sequence nucleique 
genomique SEQ ID No. 1 . 

^invention concerne de preference un acide nucleique purifie ou isole selon la 

30 presente invention, caracterise en ce qu'il comprend une sequence choisie parmi le 
groupe suivant : 

- la sequence SEQ ID No. 1 ; 

- la s'quence SEQ ID No. 2, sequence de I'ADNc codant pour la spastin humaine ; 

- la sequence SEQ ID No. 72, sequence de I'ADNc incomplet codant pour la spastin 
35 murine representee a la figure 5, ligne "Mouse" ; 
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- les sequences nucleiques homologues ou variantes des sequences SEQ ID No. 1, 
SEQ ID No. 2 ou SEQ ID No. 72 ; 

- leur sequence complementaire ; et 

- la sequence de leur ARN correspondant. 

5 De preference, I'invention conceme un acide nucleique purifie ou isole selon 

I'invention, caracterise en ce qu'il comprend au moins une mutation dont la position et 

la nature sont identifies dans le tableau 5. 

Les amorces ou sondes, caracterisees en ce qu'elles comprennent une 

sequence d'un acide nucleique selon ('invention, font egalement partie de I'invention. 
10 La presente invention conceme ainsi I'ensemble des amorces qui peuvent etre 

deduites des sequences nucleotidiques de I'invention et qui peuvent permettre de 

mettre en evidence lesdites sequences nucleotidiques de I'invention, en particulier les 

sequences mutees, en utilisant notamment une methode d'amplification telle que la 

methode PCR, ou une methode apparentee. 
15 La presente invention concerne egalement I'ensemble des sondes qui peuvent 

etre deduites des sequences nucleotidiques de I'invention, notamment des sequences 

capables de s'hybrider avec elles, et qui peuvent permettre de mettre en evidence 

lesdites sequences nucleotidiques, en particulier de discriminer les sequences 

normales des sequences mutees. 
20 La presente invention concerne en particulier les sondes ou amorces de 

sequences choisies parmi les sequences SEQ ID No. 4 a SEQ ID No. 71. 

L'invention concerne egalement ('utilisation d'une sequence d'acide nucleique 

selon I'invention comme sonde ou amorce, pour la detection, ('identification, le dosage 

ou ('amplification de sequence d'acide nucleique. 
25 Selon I'invention, les polynucleotides pouvant etre utilises comme sonde ou 

comme amorce dans des precedes de detection, ^identification, de dosage ou 

d'amplification de sequence nucleique, presenteront une taille minimale de 15 bases, 

de preference de 20 bases, ou mieux de 25 a 30 bases. 

L'ensemble des sondes et amorces selon I'invention pourront etre marquees 
30 directement ou indirectement par un compose radioactif ou non radioactif par des 

methodes bien connues de I'homme du metier, afin d'obtenir un signal detectable et/ou 

quantifiable. 

Les sequences de polynucleotides selon I'invention non marquees peuvent etre 
utilisees directement comme sonde ou amorce. 



7 

Les sequences sont generalement marquees pour obtenir des sequences 
utilisables pour de nombreuses applications. Le marquage des amorces ou des sondes 
selon invention est realise par des elements radioactifs ou par des molecules non 
radioactives. 

5 Parmi les isotopes radioactifs utilises, on peut citer le ^P, le ^P, le 3S S, le 3 H ou 

le 125 l. Les entites non radioactives sont selectionnees parmi les ligands tels la biotine, 
I'avidine, la streptavidine, la dioxygenine, les haptenes, les colorants, les agents 
luminescents tels que les agents radioluminescents, chemiluminescents, 
bioluminescents, fluorescents, phosphorescents. 

10 Les polynucleotides selon I'invention peuvent ainsi etre utilises comme amorce 

et/ou sonde dans des procedes mettant en oeuvre notamment la technique de PCR 
(reaction en chaine a la polymerase) (Erlich, 1989 ; Innis et al., 1990, et Rolfs et al., 
1991). Cette technique necessite le choix de paires d'amorces oligonucleotidiques 
encadrant le fragment qui doit etre amplifie. On peut, par exemple, se referer a la 

15 technique decrite dans le brevet americain U.S. N° 4,683,202. Les fragments amplifies 
peuvent etre identifies, par exemple apres une electrophorese en gel d'agarose ou de 
polyacrylamide, ou apres une technique chromatographique comme la filtration sur gel 
ou la chromatographie echangeuse d'ions, puis sequences. La specificite de 
Tamplification peut etre controlee en utilisant comme amorce les sequences 

20 nucleotidiques de polynucleotides de I'invention comme matrice, des plasmides 
contenant ces sequences ou encore les produits d'amplification derives. Les fragments 
nucleotidiques amplifies peuvent etre utilises comme reactifs dans des reactions 
d'hybridation afin de mettre en evidence la presence, dans un echantillon biologique, 
d'un acide nucleique cibie de sequence complementaire a celle desdits fragments 

25 nucleotidiques amplifies. 

L'invention vise egalement les acides nucleiques susceptibles d'etre obtenus 
par amplification a Taide d'amorces selon Tinvention. 

D'autres techniques d'amplification de Pacide nucleique cible peuvent etre 
avantageusement employees comme alternative a la PCR (PCR-like) a Taide de 

30 couple d'amorces de sequences nucleotidiques selon Tinvention. Par PCR-like on 
entendra designer toutes les methodes mettant en oeuvre des reproductions directes 
ou indirectes des sequences d'acides nucleiques, ou bien dans lesquelles les 
systemes de marquage ont ete amplifies, ces techniques sont bien entendu connues, 
en general il s'agit de Tamplification de PADN par une polymerase ; lorsque 

35 Pechantillon d' rigine est un ARN il convient prealablement d'effectuer une transcription 
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reverse. II existe actu llement de tres nombreux precedes permettant cette 
amplification, com me par exemple la technique SDA (Strand Displacement 
Amplification) ou technique d'amplification a deplacement de brin (Walker et al., 1992), 
la technique TAS (Transcription-based Amplification System) decrite par Kwoh et al. en 
5 1989, la technique 3SR (Self-Sustained Sequence Replication) decrite par Guateili et 
al. en 1990, la technique NASBA (Nucleic Acid Sequence Based Amplification) decrite 
par Kievitis et al. en 1991, la technique TMA (Transcription Mediated Amplification), la 
technique LCR (Ligase Chain Reaction) decrite par Landegren et al. en 1988 et 
perfectionnee par Barany et al. en 1991, qui emploie une ligase thermostable, la 

10 technique de RCR (Repair Chain Reaction) decrite par Segev en 1992, la technique 
CPR (Cycling Probe Reaction) decrite par Duck et al. en 1990, la technique 
d'amplification a la Q-beta-replicase decrite par Miele et al. en 1983 et perfectionnee 
notamment par Chu et al. en 1986 et Lizardi et al. en 1988, puis par Burg et al. ainsi 
que par Stone et al. en 1996. 

15 Dans le cas ou le polynucleotide cible a detecter est un ARNm, on utilisera 

avantageusement, prealablement a la mise en oeuvre d'une reaction d'amplification a 
I'aide des amorces selon I'invention ou a la mise en oeuvre d'un procede de detection 
a I'aide des sondes de I'invention, une enzyme de type transcriptase reverse afin 
d'obtenir un ADNc a partir de I'ARNm contenu dans Pechantillon biologique. L'ADNc 

20 obtenu servira alors de cible pour les amorces ou les sondes mises en oeuvre dans le 
procede d'amplification ou de detection selon I'invention. 

La technique d'hybridation de sondes peut etre realisee de manieres diverses 
(Matthews et al., 1988). La methode la plus generate consiste a immobiliser I'acide 
nucleique extrait des cellules de differents tissus ou de cellules en culture sur un 

25 support (tels que la nitrocellulose, le nylon, le polystyrene) et a incuber, dans des 
conditions bien definies, I'acide nucleique cible immobilise avec la sonde. Apres 
Thybridation, I'exces de sonde est elimine et les molecules hybrides formees sont 
detectees par la methode appropriee (mesure de la radioactivite, de la fluorescence ou 
de I'activite enzymatique liee a la sonde). 

30 Selon un autre mode de mise en oeuvre des sondes nucleiques selon 

(Invention, ces demieres peuvent etre utilisees comme sonde de capture, Dans ce cas, 
une sonde, dite « sonde de capture », est immobilisee sur un support et sert a capturer 
par hybridation specrfique I'acide nucleique cible obtenu a partir de I'echantillon 
biologique a tester et I'acide nucleique cible est ensuite detecte grace a une seconde 

35 sonde, dite « sonde de detection », marquee par un element facilement detectable. 
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Les sequences de site accepteur on donneur d'epissage identifies au tableau 
3 font egalement parte de la presente invention. 

Sous un autre aspect, I'invention comprend une methode pour le criblage de 
banques d'ADNc ou d'ADN genomique, ou pour le clonage d'ADNc ou genomique 
5 isole codant pour la spastin, caracterisee en ce qu'elle met en oeuvre une sequence 
nucleique selon invention. 

Parmi ces methodes, on peut citer notamment : 

- le criblage de banques d'ADNc et le clonage des ADNc isoles (Sambrook et at., 
1989 ; Suggs et al. ( 1981 ; Woo et al., 1979), a I'aide des sequences nucleiques 

1 0 selon I'invention ; 

- le criblage de banques genomiques, par exempfe de BACs (Chumakov et al., 1992 ; 
Chumakov et al., 1995) et eventuellement une analyse genetique en FISH (Cherif et 
al., 1990) a I'aide de sequences selon I'invention, penmertant I'isolement et la 
localisation chromosomique, puis le sequencage complet du gene SPG4 codant pour 

15 la spastin. 

En particulier, ces methodes selon I'invention pourront etre mises en ceuvre 
pour Tidentiftcation et ainsi Tobtention de la sequence genomique ou de I'ADNc du 
gene SPG4 chez d'autres mammiferes, notamment la souris. 

Ces methodes de criblage et/ou de clonage comprend ront en particulier une 
20 etape d'hybridation d'un acide nucleique selon ('invention avec un acide nucleique 
contenu dans une banque genomique ou d'ADNc. 

L'invention comprend aussi une methode d'identification des sequences d'acide 
nucleique promotrices et/ou regulatrices de ('expression du gene SPG4 de sequence 
SEQ ID No. 1, caracterisee en ce qu'elle met en oeuvre un acide nucleique selon 
25 I'invention. 

Les outils informatiques a la disposition de Phomme du metier lui permettent 
aisement d'identifler k partir des sequences nucleiques genomiques selon I'invention 
les boites regulatrices promotrices necessaires et suffisantes au contr&le de 
Pexpression genique, notamment les boites TATA, CCAAT, GC, ainsi que les 
30 sequences regulatrices stimulatrices (« enhancer ») ou inhibitrices (« silencers ») qui 
controlent en CIS ('expression des genes selon ('invention ; parmi ces sequences 
regulatrices, il convient de citer TIRE, MRE, CRE. 

L'invention conceme Egalement des methodes pour ('identification de mutations 
portees par le gene SPG4 humain caracterisees en ce qu'elles mettent en ceuvre une 
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sequence nucleique selon I'invention, notamment de mutations responsables de la 
paraplegie spastique familiale autosomique dominante. 

Ces methodes d'identification de ces mutations comprendront en particuiier les 
etapes suivantes : (i) isolement de I'ADN a partir de rechantillon biologique a analyser, 
5 ou obtention d'un ADNc a partir de I'ARNm de I'echantillon biologique ; (ii) amplification 
specifique de I'ADN cible susceptible de presenter une mutation a I'aide d'amorces 
selon I'invention ; (iii) analyse des produits d'amplification, notamment la taille et/ou la 
sequence des produits ^amplification, par rapport a une sequence de reference. 

Par m6thodes d'identification de mutation selon 1'invention, on entend 
10 egalement designer une methode permettant d'obtenir I'acide nucleique sur lequel a 
ete identifiee ladite mutation. 

Font egalement partie de ('invention, les sequences promotrices et/ou 
regulatrices du gene SPG4 selon I'invention presentant des mutations susceptibles de 
modifier I'expression de la proteine correspondante. 
15 Les acides nucieiques caracterises en ce qu'ils sont susceptibles d'etre obtenus 

par une des methodes precedentes selon I'invention, ou les acides nucieiques 
capables de s'hybrider dans des conditions de forte stringence (homologie d'au moins 
80 % entre une des deux sequences et la sequence complementaire de I'autr ) avec 
lesdits acides nucieiques, font partie de i'invention, notamment les acides nucieiques 
20 variants ou homologues, en particuiier les sequences nucieiques de variants alleliques 
du gene SPG4 de sequence SEQ ID No. 1 ou de son ADNc de sequence SEQ ID 
No. 2, ainsi que les sequences genomiques des genes homologues d'autres 
mammiferes tels que la souris. 

Dans la presente description, on entendra designer par "Spg4" le gene de 
25 souris homologue au gene humain SPG4. 

L'utilisation d'une sequence d'acide nucleique selon ('invention comme sonde 
ou amorce pour le criblage de banque genomique ou d'ADNc fait bien entendu partie 
de I'objet de la presente invention. 

Sous un autre aspect, I'invention comprend un polypeptide purifie ou isole code 
30 par un acide nucleique selon I'invention. 

Dans la presente description, on utilisera le terme polypeptide pour designer 
egalement une proteine ou un peptide. 

De preference, la presente invention conceme un polypeptide, caracterise en 
ce qu'il comprend un sequence d'acides amines choisie parmi le groupe suivant : 
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- la sequence SEQ ID No. 3, correspondant a la spastin humaine codee par la 
sequence SEQ ID No. 2 de I'ADNc du gene SPG4 humain ; 

- la sequence SEQ ID No. 73, correspondant a un fragment de la spastin murine codee 
par la sequence SEQ ID No. 72 de I'ADNc incomplet du gene Spg4 de souris, la 

5 sequence SEQ ID No. 73 est representee a la figure 4A, ligne "SPASTJvlOUSE" ; 

- les sequences de polypeptides homologues et variants du polypeptide de sequence 
SEQ ID No. 3 ou SEQ ID No. 73 ; et 

- les sequences de leurs fragments d'au moins 8, 10, 15, 30 ou 50 acides amines 
consecutrfs. 

10 De maniere egalement preferee, ('invention a pour objet un polypeptide, 

caract£rise en ce qu'il comprend une sequence d'acides amines choisie pamni le 
groupe suivant : 

- la sequence SEQ ID No. 3 et la sequence SEQ ID No. 73, lesquelles sequences 
portant au moins une des mutations dont la nature et la localisation sont identifies 

15 au tableau 5 ci-apres ; et 

- les sequences de leurs fragments d'au moins 8, 10, 15, 30 ou 50 acides amines 
consecutrfs. 

II doit etre compris que Hnvention ne conceme pas les polypeptides sous forme 
naturelle, c'est-&-dire qu'ils ne sont pas pris dans leur environnement. En effet, 

20 I' invention conceme les peptides obtenus par purification a partir de sources naturelles, 
ou bien obtenus par recombinaison genetique, ou encore par synthase chimique et 
pouvant alors comporter des amino-acides non naturets. La production d'un 
polypeptide recombinant, qui peut etre realisee en utilisant Tune des sequences 
nucleotidiques selon I'invention est particulierement avantageuse car elle permet 

25 d'obtenir un niveau de purete accme du polypeptide desire. 

Par polypeptide homologue, on entendra designer les polypeptides presentant 
certaines modifications par rapport au polypeptide de reference, comme en particulier 
une ou plusieurs deletions, tron cations, un allongement, une fusion chimerique, et/ou 
une ou plusieurs substitutions, et dont la sequence d'acides amines presente au moins 

30 80 %, de preference 90 % ou 95 %, d'identite apres alignement avec la sequence 
d'acides amines de reference. 

Par « polypeptide variant » (ou variant proteique), on entendra designer 
I'ensemble des polypeptides codes par les sequences nucleiques variantes telles que 
precedemment definies. 
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En particulier, les polypeptides variants comprendront tout polypeptide code par 
ta sequence genomique mutee du gene SPG4 de sequence SEQ ID N° 1, et dont la 
sequence d'acides amines presente au moins une mutation correspondant notamment 
a une truncation, deletion, substitution et/ou addition de residus d'acides amines par 
5 rapport a la sequence SEQ ID No. 3. Dans le cas present, les polypeptides variants 
presentant au moins une mutation seront lies aux pathologies de type PSF-AD. 

On entendra egalement designer par polypeptide variant tout polypeptide 
resultant de mutation d'un site d'epissage dans la sequence nucleique genomique 
SEQ ID No. 1. 

10 (.'invention comprend egalement les vecteurs de clonage et/ou d'expression 

contenant une sequence d'acide nucleique selon I'invention. 

Les vecteurs selon I'invention, caracterises en ce qu'ils comportent les 
elements permettant ('expression et/ou la secretion desdites sequences dans une 
cellule hote, ou encore une sequence d'adressage cellulaire, font egalement partie de 

15 I'invention. 

Les vecteurs caracterises en ce qu'ils comportent une sequence de promoteur 
et/ou de regulateur selon I'invention, font egalement partie de I'invention. 

Lesdits vecteurs comporteront de preference un promoteur, des signaux 
d'initiation et de terminaison de la traduction, ainsi que des regions appropriees de 
20 regulation de la transcription, lis doivent pouvoir etre maintenus de facon stable dans la 
cellule et peuvent eventuellement posseder des signaux particuliers specifiant la 
secretion de la proteine traduite. 

Ces differents signaux de controle sont choisis en fonction de I'hote cellulaire 
utilise. A cet effet, les sequences d'acide nucleique selon I'invention peuvent etre 
25 inserees dans des vecteurs a replication autonome au sein de I'hote choisi, ou des 
vecteurs integratifs de I'hote choisi. 

Parmi les systemes a replication autonome, on utilisera de preference n 
fonction de la cellule hote, des systemes de type plasmidique ou viral, les vecteurs 
viraux pouvant notamment etre des adenovirus (Penicaudet et a!., 1992), des 
30 retrovirus, des lentivirus, des poxvirus ou des virus herpetiques (Epstein et al., 1992). 
L'homme du metier connaTt les technologies utilisables pour chacun de ces systemes. 

Lorsque Ton souhaitera ('integration de la sequence dans les chromosomes de 
la cellule hote, on pourra utiliser par exemple des systemes de type plasmidique ou 
viral ; de tels virus seront, par exemple, les r6trovirus (Temin, 1986), ou les AAV 
35 (Carter, 1993). 
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Parmi les vecteurs non viraux, on prefere les polynucleotides nus tels que I'ADN 
nu ou TARN nu selon la technique developpee par la societe VICAL, les chromosomes 
artificiels de levure (YAC, yeast artificial chromosome) pour ['expression dans la levure, 
les chromosomes artificiels de souris (MAC, mouse artificial chromosome) pour 
5 I'expression dans les cellules murines et de maniere preferee les chromosomes 
artificiels d'homme (HAC, human artificial chromosome) pour I'expression dans les 
cellules humaines. 

De tels vecteurs seront prepares selon les methodes couramment utilisees par 
Thorn me du metier, et les clones en resultant peuvent etre introduits dans un note 

10 approprie par des methodes standard, telles que par exemple la lipofection, 
I'electroporation, le choc thermique. 

^invention comprend en outre les cellules notes, notamment les cellules 
eucaryotes et procaryotes, transformees par les vecteurs selon Nnvention ainsi que les 
animaux transgeniques, excepte THomme, comprenant une desdites cellules 

15 transformees selon I'invention. 

Parmi les cellules utilisables a ces fins, on peut citer bien entendu les cellules 
bacteriennes (Olins et Lee, 1993), mais egalement les cellules de levure (Buckholz, 
1993), de meme que les cellules a ni males, en particulier les cultures de cellules de 
mammiferes (Edwards et Aruffo, 1993), et notamment les cellules d'ovaire de hamster 

20 chinois (CHO), mais egalement les cellules d'insectes dans lesquelles on peut utiliser 
des precedes mettant en oeuvre des baculovirus par exemple (Luckow, 1993). Un note 
cellulaire prefere pour I'expression des proteines de I'invention est constitue par les 
cellules CHO. 

Parmi les mammiferes selon ['invention, on preferera des animaux tels que les 
25 souris, les rats ou les lapins, exprimant un polypeptide selon I'invention. 

Parmi les mammiferes selon I'invention, on preferera Egalement ceux 
comprenant une cellule transformee caracterisee en ce que la sequence de I'un au 
moins des deux alleles du gene SPG4 contient une au moins des mutations dont la 
position et la nature sont identifies dans le tableau 5 ou identifies par une methode 
30 selon la presente invention. 

Parmi les mammifdres selon I'invention, on preferera egalement des animaux 
tels que les souris, les rats ou les lapins, caracterises en ce que le gene codant pour la 
spastin selon I'invention, n'est pas fonctionnel ou est invalide. 

Parmi les modeles animaux plus particulierement interessants ici, on trouve 
35 notamment : 
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- les animaux transgeniques presentant au moins dans une de leurs deux sequences 
alleliques du g6ne SPG4, une au moins des mutations dont la position et la nature 
sont identifies au tableau 5 ou identifies par une methode selon la presente 
invention. Ces animaux transgeniques sont obtenus par exemple par recombinaison 

5 homologue sur cellules souches embryonnaires, transfer! de ces cellules souches a 
des embryons, selection des chi meres affectees au niveau des lignees 
reproductrices, et croissance desdites chimeres ; 

- les animaux (de preference souris) transgeniques surexprimant le gene SPG4 dans 
lequel pourra etre introduite une desdites mutations selon ('invention. Les souris sont 

10 obtenues par exemple par transfection de copie de ce gene sous controle d'un 
promoteur fort de nature ubiquitaire, ou selectif d'un type de tissu, ou apres 
transcription virale ; 

- les animaux (de preference souris) transgeniques rendus deficients pour le gene 
SPG4 selon I'invention, par inactivation a I'aide du systeme LOXP/CRE recombinase 

15 (Rohlmann et al., 1996) ou de tout autre systeme d'inactivation de Pexpression de ce 
g6ne. 

Les cellules et mammiferes selon I'invention sont utilisables dans une methode 
de production d'un polypeptide selon I'invention, comme decrit ci-dessous t et peuvent 
£galement servir a titre de modele d'analyse et pour le criblage de banque d'ADN 
20 (genomique ou d'ADNc). 

Les cellules ou mammiferes transformes tels que decrits precedemment 
peuvent etre ainsi utilises a titre de modeles afin d'etudier les interactions entre les 
polypeptides selon I'invention, et les composes chimiques ou proteiques, impliques 
directement ou indirectement dans les activites des polypeptides selon I'invention, ceci 
25 afin d'etudier les differents mecanismes et interactions mis en jeu. 

Surtout, ils peuvent etre utilises pour la selection de produits interagissant avec 
les polypeptides selon ('invention, notamment la spastin humaine de sequence SEQ ID 
No. 3 ou ses variants selon Tinvention, a titre de cofacteur, ou d'inhibiteur, notamment 
comp^titif, ou encore ayant une activite agoniste ou antagoniste de I'activite des 
30 polypeptides selon Invention. De preference, on utilisera lesdites cellules 
transformees ou animaux transgeniques a titre de modele permettant, notamment, la 
selection de produits permettant de lutter contre la pathologie Nee au gene SPG4 
mentionnee ci-dessus. 

Uinvention conceme egalement Tutilisation de cellule, de mammifere ou de 
35 polypeptide selon ('invention pour le criblage de compose chimique ou biochimique 



15 

pouvant interagir directement ou indirectement avec les polypeptides seion ('invention, 
et/ou capable de moduler Texpression ou Tactivite de ces polypeptides. 

L'invention concerne egalement ['utilisation d'une sequence d'acide nucleique 
selon ('invention pour la synthese de polypeptides recombinants. 
5 La methode de production d'un polypeptide de l'invention sous forme 

recombinante est elle-meme comprise dans la presente invention, et se caracterise en 
ce que Ton cultive les cellules transformees, notamment les cellules ou mammiferes de 
la presente invention, dans des conditions permettant Pexpression d'un polypeptide 
recombinant code par une sequence d'acide nucleique selon l'invention, et que Ton 
10 recupere ledit polypeptide recombinant 

Les polypeptides recombinants, caracterises en ce qu'ils sont susceptibles 
d'etre obtenus par ladite methode de production, font egalement partie de l'invention. 

Les polypeptides recombinants obtenus comme indique ci-dessus, peuvent 
aussi bien se presenter sous forme glycosylee que non glycosylee et peuvent 
15 presenter ou non la structure tertiaire naturelle. 

Ces polypeptides peuvent etre produits a partir des sequences d'acide 
nucleique definies ci-dessus, selon les techniques de production de polypeptides 
recombinants connues de I'homme du metier. Dans ce cas, la sequence d'acide 
nucleique utilisee est placee sous le contrdle de signaux permettant son expression 
20 dans un hote cell u I aire. 

Un systeme efficace de production d'un polypeptide recombinant necessite de 
disposer d'un vecteur et d'une cellule hote selon Tinvention. 

Ces cellules peuvent etre obtenues par Introduction dans des cellules hotes 
d'une sequence nucleotidique inseree dans un vecteur tel que defini ci-dessus, puis la 
25 mise en culture desdites cellules dans des conditions permettant la replication et/ou 
('expression de la sequence nucleotidique transfectee. 

Les procedes de purification de polypeptide recombinant utilises sont connus 
de I'homme du metier. Le polypeptide recombinant peut etre purifie a partir de lysats et 
extraits cellulaires, du surnageant du milieu de culture, par des methodes utilisees 
30 individuellement ou en combinaison, telles que le fractionnement, les methodes de 
chromatographie, les techniques d'immunoaffinite ^ I'aide d'anticorps monoclonaux ou 
polyclonaux specifiques, etc.. 

Les polypeptides selon la presente invention peuvent etre obtenus par synthese 
chimique et ce en utilisant Tune des nombreuses syntheses peptidiques connues, par 
35 exemple les techniques m ttant en oeuvre des phases solides ou des techniques 
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utilisant des phases solides partielles, par condensation de fragments ou par une 
synthese en solution classique. 

La technique de synthese en phase solide est bien connue de I'homme du 
metier. Voir notamment Stewart et al. (1984) et Bodansky (1984). 
5 Les polypeptides obtenus par synthese chimique et pouvant comporter des 

acides amines non naturels correspondants sont egalement compris dans ('invention. 

Les anticorps mono- ou polyclonaux ou leurs fragments, anticorps chimeriques 
ou immunoconjugues, caracterises en ce qu'ils sont capables de reconnaitre 
specifiquement un polypeptide selon I'invention, font partie de I'invention. 
1 0 Des anticorps polyclonaux specifiques peuvent etre obtenus a partir d'un serum 

d'un animal immunise contre les polypeptides selon I'invention, notamment produit par 
recombinaison genetique ou par synthese peptidique, selon les modes operatoires 
usuels. 

On notera notamment I'interet d'anticorps reconnaissant de fa$on specifique 
15 certains polypeptides, variants, ou leurs fragments immunogenes, selon Hnvention. 

Les anticorps monoclonaux specifiques peuvent etre obtenus selon la methode 
classique de culture d'hybridomes decrite par Kohler et Milstein, 1975. 

Les anticorps selon I'invention sont, par exemple, des anticorps chimeriques, 
des anticorps humanises, des fragments Fab ou F(ab') 2 lis peuvent egalement se 
20 presenter sous forme d'immunoconjugues ou d'anticorps marques afin d'obtenir un 
signal detectable et/ou quantifiable. 

L'invention conceme egalement des methodes pour la detection et/ou la 
purification d'un polypeptide selon I'invention, caracterisees en ce qu'elles mettent en 
ceuvre un anticorps selon I'invention. 
25 L'invention comprend en outre des polypeptides purifies, caracterises en ce 

qu'ils sont obtenus par une methode selon l'invention. 

Par ailteurs, outre leur utilisation pour la purification des polypeptides, les 
anticorps de l'invention, en particulier les anticorps monoclonaux, peuvent egalement 
etre utilises pour la detection de ces polypeptides dans un echantillon biologique. 
30 lis constituent ainsi un moyen d'analyse immunocytochimique ou immuno- 

histochimique de I'expression des polypeptides selon I'invention, notamment le 
polypeptide de sequence SEQ ID No. 3 ou Tun de ses variants, sur des coupes de 
tissus specifiques, par exemple par immunofluorescence, marquage a Tor, immuno- 
conjugues enzyrnatiques. 
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lis pourront permettent notamment de mettre en evidence une expression 
anormale de ces polypeptides dans les tissus ou prelevements biologiques, ce qui les 
rend utiles pour ie suivi de revolution de la maladie et ie diagnostic moleculaire. 

Plus generalement, les anticorps de l' invent! on peuvent etre avantageusement 
5 mis en oeuvre dans toute situation ou Texpression d'un polypeptide selon ('invention, 
normal ou mute, doit etre observee. 

Font egalement partie de I'invention, les methodes de determination d'une 
variability allelique, d'une mutation, d'une deletion, d'une perte d'heterozygotie ou de 
toute anomalie genetique du gene SPG4 selon I'invention, caracterisees en ce qu'elles 
10 mettent en oeuvre une sequence d'acide nucleique ou un anticorps selon I'invention. 

La presente invention comprend ainsi une methode de diagnostic genotypique 
de la pathologie associee au gene SPG4, caracterisee en ce que Ton met en oeuvre 
une sequence d'acide nucleique selon I'invention. 

De preference, I'invention conceme une methode de diagnostic genotypique de 
15 la maladie associee a la presence d'au moins une mutation sur une sequence du gene 
SPG4 a partir d'un prelevement biologique d'un patient, caracterise en ce qu'il 
comporte les etapes suivantes : 

a) Ie cas echeant, isolement de I'ADN genomique a partir de I'echantillon biologique a 
analyser, ou obtention d'ADNc a partir de TARN de I'echantillon biologique ; 
20 b) amplification specifique de ladite sequence d'ADN du gene SPG4 susceptible de 
contenir une mutation a I'aide d'amorces selon ^invention ; 
c) analyse des produits d'amplification obtenus et comparaison de leur sequence avec 
la sequence normale correspondante du gene SPG4. 

L'invention comprend egalement une methode de diagnostic de la maladie 
25 associee a une expression anormale d'un polypeptide code par Ie gene SPG4, 
notamment Ie polypeptide de sequence SEQ ID No. 3, caracterisee en ce que I'on met 
en contact un ou des anticorps selon I'invention avec Ie materiel biologique a tester, 
dans des conditions permettant la formation eventuelle de complexes immunologiques 
specifiques entre ledit polypeptide et ie ou lesdits anticorps, et en ce que Ton detecte 
30 et/ou quantifie les complexes immunologiques eventuellement formes. 

Ces methodes visent par exemple les methodes de diagnostic de la PSF-AD 
associee a la presence de mutation dans Ie gene SPG4 selon I'invention, notamment 
antenatal, en determinant a partir d'un prelevement biologique du patient la presence 
35 de mutations dans au moins une des sequences decrites precedemment. Les 
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sequences d'acides nucleiqu s analysees pourront aussi bien etre de I'ADN 
genomique, de I'ADN c, ou de I'ARNm. 

Des acides nucleiques ou anticorps bases sur la presente invention pourront 
egalement etre utilises pour permettre un diagnostic positif chez un malade ou un 
5 diagnostic pre-symptomatique chez un sujet a risque, notamment avec antecedent 
familial. 

Les methodes permettant de mettre en evidence une mutation dans un gene 
par rapport au gene sauvage sont, bien entendu, tres nombreuses. On p ut 
essentiellement les diviser en deux grandes categories. Le premier type de m6thode 

10 est celui dans leque! la presence d'une mutation est detectee par comparaison d la 
sequence mutee avec la sequence correspondante sauvage, et le second type est 
celui dans lequel la presence de la mutation est detectee de facon indirecte, par 
exemple par evidence de mesappariements dus a la presence de la mutation. 

Ces methodes peuvent mettre en oeuvre les sondes et amorces de la presente 

15 invention decrites. II s'agit generalement de sequences nucleiques d'hybridation 
purifiees comprenant au moins 15 nucleotides, de preference 20, 25 ou 30 nucleotides, 
caracterisees en ce qu'elles peuvent s'hybrider specifiquement avec une sequence 
nucleique selon I'invention. 

De preference, les conditions d'hybridation specifiques sont telles que celles 

20 definies precedemment ou dans les exemples. La longueur de ces sequences 
nucleiques d'hybridation peut varier de 15, 20 ou 30 a 200 nucleotides, 
particulierement de 20 a 50 nucleotides. 

Parmi les methodes de determination d'une variabilite allelique, d'une mutation, 
d'une deletion, d'une perte d'heterozygotie ou d'une anomalie genetique, on prefere les 

25 methodes comprenant au moins une etape d'amplification dite par PCR (reaction en 
chaine par la polymerase) ou par PCR-like de la sequence cible selon I'invention 
susceptible de presenter une anomalie a I'aide de couple d'amorces de sequences 
nucleotidiques selon I'invention. Les produits amplifies pourront etre traites a I'aide 
d'enzyme de restriction approprie avant de proceder a la detection ou au dosage du 

30 produit cible. 

Les mutations du gene SPG4 selon I'invention, peuvent etre responsables de 
differentes modifications de son produit de traduction, modifications utilisables pour 
une approche diagnostique. En effet, les modifications d'antigenicite liees a ces 
mutations peuvent permettre la mise au point d'anticorps specifiques. La discrimination 
35 du produit de gene mute peut etre realisee par ces methodes. Toutes ces modifications 
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peuvent etre utilisees dans une approche diagnostique grace a plusieurs methodes 
bien connues basees sur I'utilisation d'anticorps mono- ou polyclonaux reconnaissant 
le polypeptide normal ou des variants mutes, comme par exemple par RIA ou par 
ELISA. 

5 Sous un autre aspect, ('invention comprend une methode de selection d'un 

compose chimique ou biochimique capable de prevenir et/ou de traiter la PSF-AD 
associee au gene SPG4 t caracterisee en ce que Ton met en ceuvre une sequence 
d'acide nucleique selon I'invention, un polypeptide selon Tinvention, un vecteur selon 
I'invention, une cellule selon Pinvention, un mammifere selon invention ou un anticorps 

10 selon Tinvention. 

Sont egalement comprises dans Tinvention, les methodes de selection de 
composes chimiques ou biochimiques capables d'interagir directement ou 
indirectement avec des polypeptides selon ('invention ou avec les acides nucleiques 
selon i'invention, et/ou permettant de moduler Texpression ou Tactivite de ces 

15 polypeptides, caracterisees en ce qu'elles comprennent la mise en contact d'un 
polypeptide selon I'invention, d'une cellule transformee selon I'invention, ou d'un 
mammifere selon Tinvention, avec un compose candidat et, la detection d'une 
modification de Tactivite dudit polypeptide. 

Par exemple, mais sans s'y limiter, on peut citer une methode ^identification de 

20 molecules capables d'interagir avec un polypeptide selon I'invention en utilisant un 
systeme de double hybride bacterien ou levure tel que le Matchmaker Two Hybrid 
System 2, selon les instructions du manuel accompagnant le Matchmaker Two Hybrid 
System 2 (Catalogue N° K1 604-1, Clontech). 

Les acides nucleiques codant pour des proteines interagissant avec les 

25 sequences promotrices et/ou regulatrices du gene SPG4 selon Tinvention, peuvent etre 
crib les et/ou selectionnes en utilisant un systeme de simple hybride tel que cetui decrit 
dans le manuel accompagnant fe kit Matchmaker One-Hybrid System de Clontech 
(Catalog N° K1603-). 

Sous un autre aspect, Tinvention comprend I'utilisation d'acide nucleique ou de 

30 polypeptide selon Tinvention, d'un vecteur selon Tinvention, d'une cellule selon 
Tinvention, ou d'un mammifere selon Tinvention, pour Tetude de Texpression ou de 
Tactivite du gene SPG4. 
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D'autres caracteristiques et avantages de I'invention apparaissent dans la suite 
de la description avec les exemples et les figures dont les legendes sont representees 
ci-apres. 

5 LEGENDES DES FIGURES 

FIGURES 1A, 1B et 1C : Carte physique de I'intervalle SPG4 et organisation 

genomique de SPG4. 

FIGURE 1A : La region candidate de 1,5 Mb est delimitee par les marqueurs 

genetiques D2S352 et D2S2347 indiquSs en caracteres gras. La position des 
10 marqueurs polymorphes et autres STSs est indiquee en caracteres standards alors 

que la position des ESTs est indiquee en italique. Les clones de BAC constituant la 

carte de presequencage sont representes par des rectangles dont le nom figure au- 

dessus et la tail I e precise du clone au-dessous si celle-ci a pu etre determinee. Le nom 

des BACs A, B, C... est suivi d'une parenthese contenant le nom du clone precede 
15 d'un « b » si le clone est issu de la banque de BACs CITB_978_SKB ou d'un « B » si 

celui-ci provient de la banque RPCI-11. 

FIGURE 1B : Representation schematique du gene SPG4 qui chevauche les 

BACs D (b336P14) et G (B563N4). Les exons sont figures comme des rectangles noire 

avec leur nom au-dessus. 
20 FIGURE 1C : Les cinq mutations identifies dans sept families de PSF-AD li ' es 

au locus SPG4 sont positionnees dans les exons 7, 11, 13 et dans le site accepteur 

d'epissage de I'intron 15. 

FIGURE 2 : Sequence nucteique et proteique de I'ADNc SPG4 et de la spastin. 

Les 17 barres verticales avec un nombre situe au-dessous represented les 

25 jonctions entre les differents exons. Le codon ATG initiateur est localise en position nt 
126-128 et le codon STOP de terminaison en position nt 1974-1976. Cinq des 
mutations identifies a ce jour, dont la perte de I'exon 16 f sont indiquees en italique (nt 
1210, nt 1468, nt 1520, nt 1620 et pour la perte de I'exon 16 : nt 1813-1853). Le site de 
polyadenylation est en italique et souligne. Le signal de localisation nucl6aire (NLS) 

30 putatif, RGKKK, ainsi que les trois domaines conserves predits par ('analyse dans la 
base de donnees ProDom sont respectivement localises aux positions aa7-11 (NLS), 
aa342-409 (domaine 92), aa41 1-509 (domaine 179) et aa512-599 (domaine 6226). Les 
quatre motifs predits par la comparaison de sequence dans la base de donnees 
Prosite sont : deux motifs «leucine zippers» aux positions aa50-78 et aa508-529, le 

35 site de fixation de I'ATP (ou motif A de Walker) aux positions aa382-389 et le domaine 
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de dimerisation « helix-loop-helix » aux positions aa478-486. Les motifs A et B de 
Walker, «GPPGNGKT» et «IIFIDE», ainsi que le consensus minimal des AAA sont 
soulignes. 

FIGURES 3A, 3B et 3C : Caracterisation d'une mutation d'un site d'epissage chez les 
5 individus atteints de trois families de PSF-AD liee au locus SPG4. 

FIGURE 3A : Amplification par PGR du fragment IV de I'ADNc SPG4 a partir 
d'ADNc de lymphoblastes : puits M, marqueur de taille VII (Boehringer) ; puits 1, 
membre non atteint de la familfe 2992 ; puits 2, patient de la famille 2992 ; puits 3, 
membre non atteint de la famille 5330 ; puits 4, patient de la famille 5330 ; puits 5, 
10 patient de la famille 5226 ; puits 6, temoin negatif (ADN genomique humain). 

FIGURE 3B : G raphe de sequence de fa mutation du site accepteur d'epissage 
de I'intron 15. 

Sequence genomique de I'individu controle en haut et d'un patient de la famille 
2992 en bas. L'asterisque a la position nt 1813-4 indique un polymorphisme A->C qui 
15 touche un nucleotide non conserve du site accepteur d'epissage de I'intron 15 chez le 
patient. 

FIGURES 4A et 4B : Les homologies de la spastin. 

Les residus conserves et identiques sont respectivement surlignes en bleu et 

jaune. 

20 FIGURE 4A : Alignement multiple cree par CLUSTAL W de huit proteines 

issues de divers organismes et presentant une forte homologie de sequence avec les 
spastin humaine et murine (SEQ ID No. 73). 

FIGURE 4B : Alignement par CLUSTAL W des metalloproteases de levure 
AFG3, RCA1 et YME1, etdes paraplegin et spastin humaines. 

25 FIGURE 5 : Alignement par BLASTN des sequences nucleiques de I'ADNc SPG4 et de 
son orthologue de souris Spg4 (SEQ ID No. 72). Le site de polyadenylation de I'ADNc 
murin est souligne et en italique. Le codon STOP est localise en position nt 1515-1517 
dans I'ADNc murin et en position nt 1974-1976 dans I'ADNc humain. 
FIGURES 6A, 6B et 6C : Analyse par PCR de I'expression de SPG4 et de son 

30 orthologue murin Spg4. 

FIGURE 6A : Collection d'ADNc provenant de multiples tissus de souris. 
Puits M, marqueur de taille V (Boehringer) ; puits 1, coeur ; puits 2, cerveau ; 
puits 3, rate ; puits 4, poumon ; puits 5, foie ; puits 6, muscle squelettique ; puits 7, 
rein ; puits 8, testicule ; puits 9, embryon de 7 jours E7 ; puits 10, embryon de 11 jours 
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E11 ; piiits 11, embryon de 15 jours E15 ; piiits 12, embryon de 17 jours E17 ; puits 13, 
temoin negatif (ADN genomique de souris). 

FIGURE 6B : Collection d'ADNc provenant de multiples tissus humains. 

Puits M, marqueur de taille VII (Boehringer) ; puits 1, cerveau ; puits 2, coeur ; 
5 puits 3, rein ; puits 4, foie ; puits 5, poumon ; puits 6, pancreas ; puits 7, placenta ; puits 
8, muscle squelettique ; puits 9, temoin negatif (ADN genomique humain) ; puits 10, 
temoin negatif (pas d'ADN). ' 

FIGURE 6C : Collection d'ADNc provenant de multiples tissus de foetus 
humain. 

10 Puits M, marqueur de taille VII (Boehringer) ; puits 1, cerveau ; puits 2, cceur ; 

puits 3, rein ; puits 4, foie ; puits 5, poumon ; puits 6, muscle squelettique ; puits 7, 
rate ; puits 8, thymus ; puits 9 t temoin negatif (ADN genomique humain) ; puits 10, 
temoin negatif (pas d'ADN). 



15 EXEMPLES 

Exemple 1 : Materiels et methodes 

1) Sous-clonage et sequengage de la region candidate 

Douze BACs provenant de deux banques genomiques humaines, 
CITB_978_SKB (commercialisees par Research Genetics) et RPCI-11 (18), et 

20 recouvrant I'intervalle SPG4 ont ete selectionnes pour §tre sequences (Hazan et al., 
sous presse dans Genomics). 40 ug de I'ADN de chaque BAC a 6te digere 
partiellement par I'enzyme de restriction CviJI (CHIMERx) et separe par electrophordse 
sur gel d'agarose 0,4 % LMP (FMC). Des fractions d'ADN dont les tailles varient autour 
de 3, 5 et 10 kb ont ete eludes avec la p-agarase (Biolabs) et liguees a un vecteur 

25 plasmide pBAM3 pr^alablement digere par Smal et dephosphoryle dans un rapport de 
IXinsert pour 5Xvecteur. Des bacteries E. coli DH10B electrocompetentes (GIBCO- 
BRL) ont ete transformees par electroporation avec les differentes ligations. Environ 
1000 a 1500 sous-clones par BAC (8 a 10 genomes equivalents) composes de 20 % 
de clones avec inserts a 10 kb, 40 % de clones avec inserts a 5 kb et 40 % de clones 

30 avec inserts a 3 kb ont ete isoles. Les extremites des inserts de ces clones ont ete 
sequencees sur un sequenceur automatique LI COR 4200. Pour chaque BAC, les 
sequences furent assemblies en un squelette constitue de plusieurs contigs a Taide 
des logiciels Phred et Phrap. Les trous entre chaque contig furent sequences avec des 
dideoxynucleotides marques sur un sequenceur ABI 377 (PE-Applied Biosystems). Les 

35 exons contenus dans ces contigs de sequence ont et§ predits par les programm s 
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informatiques GRAIL II, GENSCAN, FGENEH et Genie. Les sequences furent 
egalement comparees dans les bases de donnees nucleiques et proteiques de I'EMBL 
et de GenBank avec les programmes BLASTN et BLASTX. La determination des 
sequences promotrices fut realisee par les programmes informatiques TSSG et TSSW. 
Les resultats de toutes ces analyses de sequences furent visualises par le programme 
d'annotation de sequence Genotator. 
2) Clonage de I'ADNc 

L'ADNc du gene SPG4 a ete isole par des experiences de RACE-PCR en 5' et 
3* sur des ARN po!yA+ de cerveau foetal, cerveau adulte et foie adulte a Paid du kit 
d'amplification d'ADNc Marathon (Clontech), selon les instructions du fournisseur. Une 
premiere PCR, suivie d'une PCR interne furent effectuees avec differents couples 
d'amorces dont les sequences sont indiquees sur le tableau 1 ci-apres : 
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Tableau 1 

Amorces utilisees pour les RACE-PCR et les amplifications d'ADNc 



Amorce 


Sequence (S'-Z*) Position en 5' couple/ PCR Taille du produit 


SPA_5RACE5 


CGGAGCTCCTCTTGGCTGCCATG 


nt405 






SPA_5RACE6 


AGAAGCGCTGGCAGAGCCACACGAAG 


nt 372 

III w f ^ 






SPA_5RACE7 


AAGGCGACCAAACGCAGCAGCGCGAAG 


nt 331 






SPA_3RACE1 


AGGAGCAAGCTGTGGAATGGTATAAG 


nt 550 






SPA.3RACE2 


TGGTTATGGCCAAGGACCGCTTACAAC 


nt 689 






SPAJ3RACE3 


CAAACGGACGTCTATAATGACAGTAC 


nt 747 






SPA_3RACE4 


TTAGGAATGTGGACAGCAACCTTGC 


nt1075 






SPA_3RACE5 


CTTCTCTGAGGCCTGAGTTGTTCAC 


nt1207 






SPAJ5RACE6 


TGCTAGAATGACTGATGGATACTCAGG 


nt1736 






SPA_3RACE7 


AGATGCAGCACTGGGTCCTATCCG 


nt1787 






SPA_3RACE8 


ATGAACGTCATCGGCTACAGAAACAG 


nt2037 






SPA_Db 




m 40 




DOD pD 


SPA_Dm 


A AfSOrsrSTPPTTWi CT* ATA A f* 


nt /uu 






SPA_Dc 


C5 Grfifir AttTf5 A(5 Af^PTfi Ttt 

V3w\A3UunV3 1 OnV3AUw 1 VJ 1 


ni i uo 




040 pD 


SPAJDn 


CTAG CTCTTTCACACTGTTC 


III u*w 






SPA_Ad 


AACAGGCCTTCGAGTACATC 


nt 487 


d+n 


746 pb 


SPA_Am 


CTGTGAACAACTCAGGCCTC 


nt 1233 






SPA.Ac 


ATGAGAAAGCAGGACAGAAG 


nt 53? 

Ill ij<&£. 






SPA.An 


TGCCAAGTCTTGACCAGC 


nt1175 






SPA_Ba 


CTACAACTGCTACTCGTAAG 


nt1036 


a+m 


763 pb 


SPA_Bm 


CAGTGCTGCATCTTTTGCC 


nt 1799 






SPA_Bb 


TAGGAATGTGGACAGCAACC 


nt 1076 






SPA_Bn 


AAAGCTGTTAGGTCACTTCC 


nt 1780 






SPA_Ca 


TGGAGATGACAGAGTACTTG 


nt1550 


a+m 


766 pb 


SPA_Cm 


CTGGAATACTTTCATCTGC 


nt 2316 






SPA_Cb 


ATGAGGCTGTTCTCAGGCG 


nt 1603 
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Les produits de RACE-PCR ont 'te clones avec le kit TA-cloning (Invitrogen) et 
les clones correspondents ont ete sequences sur un ABI 377 (PE-Applied Biosystems). 
La sequence du transcrit SPG4 a ete verifiee par le sequencage de produits de PCR 
amplifies a partir d'une population d'ADNc provenant des lymphoblastes de 6 individus 
5 sains. 

3) Detection des mutations 

Les ARNs totaux ont ete extraits de lignees de lymphoblastes d'un individu 
atteint par famille etudiee et de 6 individus temoins a I'aide du kit RNA PLUSR 
(bioprobe System). La synthese de I'ADNc a ete realisee sur 500 ng a 1 ug d'ARN 

10 avec 100 pmoles d'amorces hexameres aleatoires (Pharmacia) et 200 unites de 
reverse transcriptase Superscript II (Gibco BRL) dans des conditions standards. 
Quatre amplifications par PCR t generant des fragments chevauchants qui recouvrent 
la totalite de la phase ouverte de lecture de SPG4, ont ete realisees sur les ADNc des 
patients et controles. Le fragment I fut amplifie avec les amorces SPA_Db/SPA_Dm, 

15 puis en PCR interne avec les amorces SPA_Dc/SPA_Dn. Les fragments II, III, et IV ont 
ete respectivement amplifies avec les amorces SPA_Ad/SPA_Am, SPA_Ba/SPA_Bm 
et SPA_Ca/SPA_Cm (cf. les sequences de ces amorces sur le tableau 1). Chaque 
amplification a ete effectuee dans un volume total de 50 ul contenant 4 pi d'ADNc (~ M7 
erne de la prep.), 20 pmoles de chaque amorce, 200 uM de dNTPs, 50 mM de KCI, 

20 10 mM de Tris pH9, 1,5 mM MgCI2, 0,1 % de triton X-100, 0,01 % de gelatine et 2,5 
unites de Taq polymerase (Cetus-PE). Les reactions de PCR ont ete realisees selon le 
procede du « hot start » : la Taq polymerase est ajoutee a 92°C apres une premiere 
etape de denaturation de 5 min a 94°C. Les echantillons sont par la suite soumis a 35 
cycles de denaturation (94°C pendant 40 sec), d'hybridation (55°C pendant 50 sec, a 

25 I'exception du fragment 1 : 58°C pendant 50 sec) et d'elongation (72°C pendant 1 min), 
suivis d'une demiere etape d'elongation (5 min a 72°C). Les produits de PCR sont 
sequences sur un sequenceur automatique ABI 377 (PE-Applied Biosystems) avec les 
amorces SPA_Dc/SPA_Dn, SPA_Ac/SPA_An, SPA_Bb/SPA„Bn et SPA_Cb/SPA_Cm 
pour les fragments I, II, III et IV respectivement. 

30 Les mutations furent egalement recherchees ou confirmees par sequencage 

des 17 exons predits du gene SPG4 chez les patients et controles. Chaque exon fut 
amplifie avec le couple correspondant d'amorces « a+m » (cf. tableau 2 ci-apres), a 
I'exception de I'exon 1 (gSPAexIc/gSPAexIm), et des exons 10, 11 et 12 qui furent co- 
amplifies avec les couples d'amorces gSPAex10a/gSPAex12m et 

35 gSPAexl 1a/gSPAex12m. 
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Tableau 2 

Amorces de PCR pour ('amplification et le s6quengag des exons 



Exon 


Taille du prod u it Programme de PCR Amorce 


Sequence (S'-y) 


1 


1048 pb 


0 


gSPAexIc 


GTGAGCCGAACTGCACATTG 








gSPAexIm 


CAAAGTCGACAGCTACAGTGC 








gSPAexld 


GGAACTGTAGTTGAGTGGGA 








gSPAexIn 


AGATGAGGCTCCGACCTAC 


2 


624 pb 


3 


gSPAex2a 


AATGCCACACTTGTAATCTC 








gSPAex2m 


TGTGAATATATCATAATTTGGG 








gSPAex2b 


TACAGCAGTTCTCATGATG 


3 


812 pb 


1 


gSPAex3a 


GACCAAATTGGTGCATGCATG 








gSPAex3m 


ACATTTCCAATACATCCCAC 


4 


379 pb 


3 


gSPAex4a 


ATTTGTCATTTCACATGCAC 








gSPAex4m 


TTAGAATGACTATACCTGAC 








gSPAex4n 


TCAGGTTAAGTAAGACTC 


5 


830 pb 


4 


gSPAexSa 


TTCCTATCTACCTAGTGAC 








gSPAexSm 


I I I I ATAGCAAGTTGCCCTG 








gSPAexSb 


CCTATGAAGATCCTGGTAC 


6 


484 pb 


3 


gSPAex6a 


TGTCATGATTCTAACAAGGG 








gSPAex6m 


TCTATTTCACTCCTGACATG 


7 


420 pb 


2 


gSPAex7a 


GTCATAGGGCTTAGGCTTC 








gorAex/m 


ATCATACTACCCAC I I l ICC 


8 


647 pb 


3 


gSPAex8a 


lol I I bbbAAoA I I AO! o 








gSPAex8m 




9 


1268 pb 


1 


gSPAex9a 


CATTGATTGCCATGTATTGG 








gSPAexSm 


AGAAGGCCAGAAATACTCAG 








gSPAex9b 


GTACTTAAATCGGTAAATATGG 


10l 


1061 pb 


4 


gSPAexlOa 


CTCAAGTCTTAGGAATGCAG 


11| 






gSPAexlOb 


GCACTTAACCAGGCTGTATG 


12j 


551 pb 


3 


gSPAex11a 


CTCAGATGACTCACATAGC 








gSPAex12m 


CTTTACTAGACTAATTCTCCTG 
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I o 


1^1 nh 


4 


nSPApx13a 


CAGATTCAAGAAGACAGATG 








yorncA i oi 1 1 


GP^ATAATTOAGGACAOTTG 








yorncA i <ji i 


GnTAGTTrTTGTTTnTnr.TP 

\J\J 1 y^vJ 1 1 1 1 VJ 1 1 IV/I VJv 1 V-/ 




SOU fJU 


4 


n^PApy14a 


rAAfiTGTGGTGAATTATTGP 








nRPAPvi 4m 
yorncA i *ti 1 1 


GAGnTHAAAAGTATTnAGP 








nSPApy14n 


TGCAAAGGAfiATAGCnAGTG 






1 


yorncA i oo 


AGPPTfTrGGAGATAGTATGP 








aSPAex15m 

ywrncA i vi 1 1 


CTAGAACAGGGGTCACAGTC 








gSPAex15n 


TTGGACTTCTTAAACTTC 


16 


1404 pb 


4 


gSPAex16a 


GCAGTATGCAAGAAATTGAAC 








gSPAex16m 


GGCCTGTAATTTTCTTCTG 








gSPAex16b 


GTACTGAATAGATACATGTAG 


17 


445 pb 


3 


gSPAex17a 


GTGTAGCAGATCAACATAG 








gSPAex17m 


CATCTTCAAGTTTGGTGCAC 



Hormis I'exon 1, amplifie a I'aide du kit Advantage GC genomic PCR kit 
(Ciontech) selon les instructions du foumisseur, quatre programmes de PCR 
legerement differents (1,2,3 et 4) furent utilises pour amplifier les exons de SPG4 (voir 
5 tableau 2). Les amplifications furent toutes effectuees dans un volume de 50 ul 
contenant 100 ng d'ADN genomique, 50 pmoles de chaque amorce, 250 uM de 
dNTPs, 1X de tampon Takara et 1 unite de Taq polymerase Takara La Taq (Shuzo 
Co.). Les reactions de PCR ont ete realisees selon le precede du « hot start » : la Taq 
polymerase est ajoutee a 94°C apres une premiere etape de denaturation de 5 min £ 

10 96°C. Les echantillons sont par la suite soumis a 30 cycles de denaturation (94°C 
pendant 40 sec), d'hybridation (prog. 1 : 60°C pendant 50 sec ; prog. 2, 58°C pendant 
50 sec, prog. 3 et 4 : 55°C pendant 50 sec) et d'elongation (prog. 1 et 4 : 72°C pendant 
1 min, prog. 2 et 3 : 72°C pendant 40 sec), suivis d'une demiere etape d'elongation (10 
min a 72°C). Le sequencage de ces produits de PCR a ete realise sur un sequenceur 

15 ABI 377 (PE-Applied Biosystems) en utilisant soit les amorces de PCR soit les 
amorces internes notees « b » et « n » (voir tableau 2). 
4) Caract ' risation de SPG4 

Les clones d'ADN c 977312 (EST AA560327) et 568234 (EST AA1 07866) issus 
des banques d'ADNc de blastocyste et d'embryon E8 de souris, qui tous deux 
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correspondent a I'orthologue murin de SPG4, ont ete isoles par le consortium IMAGE 
et sequences au laboratoire sur un sequenceur ABI 377 (PE-Applied Biosystems). Afin 
d'analyser le profil d'expression de SPG4 et de son orthologue murin Spg4, les 
collections d'ADNc de differents tissus humains fcetaux et adultes, ainsi que de tissus 
5 de souris (panels MTC, Clontech) ont ete testees par PGR selon le protocole du 
foumisseur avec le couple d'amorces SPA_Ca/SPA_Cm pour les ADNc humains et le 
couple SPA_Ca /spam (spam : 5-ACCGAAGTCAAGAGCCTATC-3') pour les ADNc de 
souris. Les conditions de PCR sont celles utilisees pour I'amplification de SPG4 £ partir 
d'ADNc de lignees de lymphoblastes (cf. § Detection des mutations), excepte que les 
10 echantillons ont ete soumis a 32 cycles pour les ADNc issus de tissus adultes humains 
et de tissus murins, et a 28 cycles pour les ADNc issus de tissus fcetaux. Les produits 
d'amplification ont migre par electrophorese sur des gels d'agarose 2 %. 

5) Analyse histologique d'une biopsie musculaire d'un patient 

Les analyses histologiques et histo-enzymatiques ont ete realisees a partir 
15 d'une biopsie musculaire d'un patient issu d'une famille liee au locus SPG4 selon les 
techniques standards decrites dans Casari et al. (17). 

6) Numeros d'accession dans les bases de donnees publiques 

L'ADNc SPG4 (ou SPAST) et la sequence proteique deduite, GenBank/EMBL 
AJ246001 ; le clone d'ADNc incomplet Spg4, GenBank/EMBL AJ246002 ; le g'n 

20 SPG4 (ou SPAST), GenBank/EMBL AJ246003. 

Exemple 2 : Analyse de la sequence de I'intervalle SPG4 

L'analyse des evenements de recombinaison a permis de reduire la region 
candidate SPG4 a un intervalle genetique de 0 cM entre les marqueurs D2S352 et 
D2S2347 (19, 20). Une carte de presequencage de I'intervalle SPG4 compose de 37 

25 BACs a ete construite (Hazan et al., sous presse dans Genomics) ; la region candidate 
couvre une distance physique d'environ 1,5 Mb. Douze BACs chevauchants, 
s'etendant sur I'intervalle SPG4 a I'exception d'un unique trou de 4 kb entre les clones 
A et E, ont ete selectionnes pour etre sequences (Fig. 1 A). Sept de ces BACs (A, B, C, 
D, E, F et G), couvrant approximativement 70 % de la region d'interet, ont deja 'te 

30 sequences. Les sequences de ces 7 BACs ont ete comparees a celles des bases de 
donnees nucleiques et proteiques, et analysees avec quatre programmes de prediction 
d'exons. Ces analyses de sequences preliminaires ont permis de mettre en evidence 
14 unites de transcription potentielles, dont trois correspondant aux genes codant pour 
la xanthine deshydrogenase, la steroTde 5a-reductase 2 et une proteine liant le TGFp. 

35 Sur les 14 genes detectes par l'analyse de sequence, 9 avaient ete prealablement 
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identifies dans les bases de donnees d'EST (pour « Expressed Sequence Tag ») et 
localises au sein de Hntervalle SPG4 (Hazan et al, sous presse dans Genomics) ; les 
5 genes restants n'ont pu etre identifies qu'en sequengant la region candidate. Lun de 
ces 5 nouveaux genes presentait une homologie en 3' de sa region codante avec les 
5 genes codant pour la famille proteique des AAA (16). Des analyses de sequence plus 
approfondies ont montre que ce gene, nomme SPG4 (ou SPAST), etait compose de 17 
exons et s'etendait sur une region d'environ 90 kb, couverte par deux clones de BAC 
adjacents, D et G (cf. Fig. 1B). Les trois premiers exons predits de ce gene furent 
identifies dans le BAC D par deux des quatre programmes de prediction d'exons 

10 utilises, GRAIL II et GENSCAN ; ils presentent une forte homologie avec un EST de 
blastocyste de souris, AA560327. Les 14 derniers exons se trouvent dans le BAC G. 
La sequence proteique deduite des exons 7 a 17 est significativement homologue a 
une sous-classe de la famille des AAA, comportant les proteines de levure Yta6p (21), 
TBP6 (21) et End 13, ainsi que la proteine de souris SKD1 (22). 

15 Sur les quatre programmes de prediction d'exons, FGENEH semble le plus 

fiable et le plus puissant, permettant la detection de la plupart des genes de cette 
region chromosomique en 2p21-p22. Cette constatation s'applique egalement au gene 
SPG4 pour lequel 15 exons ont pu etre mis en evidence par ce programme quand 
seuls 4, 9 ou 11 exons ont pu respectivement etre localises par les programmes Genie, 

20 GRAIL II et GENSCAN. ^organisation genomique de ce gene (Fig. 1B) a pu etre 
confirmee par la suite grace a la determination de la sequence de TADNc SPG4. Les 
jonctions introns/exons sont representees sur le tableau 3 ci-apres : la taille des exons 
varie de 41 pb (exon 16) a 1,410 kb (exon 17), celle des introns variant de 140 pb 
(intron 1 1) a 23,247 kb (intron 1). 

25 
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Exemple 3 : Identffication de I'ADNc SPG4 

Plusieurs amplifications successives par RACE-PCR en 5' et 3' furent realisees 
sur des collections d'ADNc de cerveau et de foie adultes et de cerveau foetal, afin de 
caracteriser le transcrit SPG4. Toutes les RACE-PCR en 5' ont donne des produits 
5 d'amplification se terminant a la position nt 263 de I'ADNc SPG4 (Fig. 2), ce qui etait 
probablement du au contenu riche en GC de la region 5' du transcrit (90 % de GC dans 
les 60 pb precedant la position nt 263). Quatre produits de PCR chevauchants, 
recouvrant la totalite de la region codante, ont ete amplifies a partir des ADNc issus 
des lymphoblastes de six individus controles et sequences integralement dans le but 

10 de verifier la sequence du transcrit SPG4. L'alignement des sequences de tous les 
produits de PCR et RACE-PCR a permis de reconstituer une sequence de 3263 pb 
comprenant une phase ouverte de lecture de 1848 pb precedee par une region 5* non 
traduite (5* UTR pour « 5' UnTranslated Region ») de 125 pb et suivie par une region 3' 
UTR de 1290 pb incluant un site de polyadenylation entre les positions nt 3227-3232, 

15 -35 pb en amont de la queue polyA (Fig. 2). La comparaison de la sequence de 
I'ADNc SPG4 avec les banques de donnees d'ESTs a permis de detecter une 
homologie significative avec 6 ESTs humains dont TEST N47973 qui contient une 
region 3' non codante plus etendue (+ 180 pb) comprenant un deuxieme site de 
polyadenylation. Le site d'initiation de la traduction a ete identifie par la presence d'une 

20 sequence consensus de Kosak (CTGTGAatgA) definie comme un «contexte adequate 
a Tinitiation de la traduction attendu qu'une purine est localisee 3 nt en amont de I'ATG 
initiateur, lui-meme precede d'un codon STOP. La sequence de I'ADNc de 3263 pb est 
identique a la sequence transcrite deduite des 1 7 exons du gene SPG4. L'analyse de 
la sequence de la region 5* a I'aide des programmes informatiques TSSG et TSSW 

25 suggere la presence d'une sequence promotrice de type TATA box situee 43 pb en 
amont de la position nt 1 de I'exon 1. 
Exemple 4 : Mutations dans le gene SPG4 

Des mutations heterozygotes ont ete recherchees dans I'ADNc SPG4 
provenant de lymphoblastes de 14 patients issus de families liees au locus SPG4 (1 

30 individu atteint par famille). Quatre fragments de PCR chevauchants I, II, III et IV 
recouvrant la phase ouverte de lecture de PADNc SPG4 ont ete amplifies et sequences 
chez les 14 patients ainsi que chez 6 individus sains controles. L'electrophorese sur 
gel agarose du fragment de PCR IV a montre trois bandes d'intensite egale chez 3 
patients des families 2992, 5226 et 5330 provenant de la meme region de Suisse, ce 

35 qui suggerait une microdeletion ou une mutation d'un site d'epissage ; les deux bandes 
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supplSmentaires n'etaient pas presentes chez 2 individus sains issus des families 2992 
et 5330 (Fig. 3A). La sequence genomique de I'exon 16 a revele une mutation 
het6rozygote A->G du site accepteur d'epissage (AG) de I'intron 15 chez les individus 
atteints de ces trois families (Fig. 3B) ; cette mutation engendre la perte de I'exon 16 

5 suivie d'un decalage de la phase de lecture dans le transcrit anormal. Aucun des 
membres sains incluant maris et 6pouses ne porte cette mutation du site d'epissage. 
^identification de la meme mutation chez tous les membres atteints de ces trois 
families suisses d6montre ('existence d'un ancetre commun, ce qui avait §te 
prealablement sugg6r6 par I'etude des haplotypes. 

10 Trois mutations ponctuelles 1210C->G, 1468G->A et 1620C->T qui introduisent 

des substitutions d'un acide amin6 dans la sequence proteique (S362C, C448Y et 
R499C) ont §te respectivement mises en evidence par le s6quen$age des fragments 
de PGR III et IV chez les individus atteints des families 624, 4014 et 618. Ces trois 
substitutions impliquent toutes un r6sidu cysteine, induisant la perte ou I'insertion d'une 

15 cysteine dans la sequence proteique. Une deletion de 1 pb, 1520delT, qui cree 
Tapparition d'un codon STOP induisant une proteine tronqu6e composee de 465 
acides amines (aa) a 6t§ detectee chez les individus atteints de la famille A. Aucune 
des cinq mutations resum6es dans le tableau 4 ci-aprds n'a 6t6 trouvee chez les 
individus controles testes, qu'ils appartiennent a la fratrie saine ou aux conjoints des 

20 sept families analyses ici. Ces cinq mutations affectent de fa^on importante la 
sequence proteique dans un domaine tres conserve, ou cassette AAA (23), qui est 
compose de plusieurs motifs proteiques supposes etre responsables de I'activite 
ATPase chez tous les membres de la famille des AAA. 
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En addition a ces cinq mutations decrites precedemment, des recherches de 
mutations heterozygotes realisees sur des patients atteints de PSF-AD issus de 36 
autres families ont permis de mettre en evidence 34 autres mutations alterant ou 
susceptibles d'alterer le produit ^expression du g§ne SPG4. 

Les caracteristiques de ces 34 autres mutations sont resumees dans le tableau 
5 ci-apr&s dans lequel ont 6t6 6galement inserees les cinq premieres mutations 
precedemment citees. 
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Tableau 5 

Mutations dans SPG4 chez les patients atteints de PSF-AD 



Famille 


Localisation 


Mutation 8 


Changement d'acide amine b 


Consequence 


£DA 


cxon 7 


1210 Ci-*G 


S362C 


IctUJW oCllia 




exon 8 


1 Z J O vJ rrn 


G370R 


4ahv cmic 

J-ilLLA. SCIUt 


01 A 

£.1** 


cxon 8 


I/O / 1 I — t\J 


F381T 




1UUZ 


cxon o 


1ZOJ 1 1 — 7U 


N386K 




UZ / 


cxon o 




K388R 


■fa nv cpnc 




cxon 10 


14U1 CI— Hj 


L426V 


laUA 0CII0 


4014 


exon 11 


1468 G i-*A 


C448Y 


fe.ux sens 


148 


exon 11 


1 ^04 G i— »T 


R460L 


faux sens 


618 


exon 13 




R499C 


faux sens 


636 


exon 15 


X /oo vJ J — rj\ 


D555N 


faux sens 


627 


exon 15 


1 TOO 1"^ i vT 

1 /fZ J — * J. 


A556V 


faux sens 


2971 


exon 3 


702 C h- >T 




non sens 


3655 


exon 5 


873 A h-»T 


Kzz9^ 1 OF 


non sens 


1010 


exon 5 


907 C i-»A 


dzolMUF 


non sens 


3938 


exon 5 


932 C f-»G 


Yzo9alUr 


non sens 


6922 


exon 10 


1416 C h-»T 


K431MUP 


non sens 


616 


exon 10 


1416Ch->T 


K43 1 5> I UP 


non sens 


605 


exon 15 


1809 Ch^T 


K5o2aTUP 


non sens 


030 


exon 2 


578-579insA 


PTC + 2aa 


decalage + non sens 


fi\ ^ 

Ol J 


cxon J 


ojzaeii i 


rit + io aa 


decalage + non sens 


HA 9 

u^tz 


exon j 


ooz-oo oinsA 


riL + iz aa 


decalage + non sens 




CA.UU J 


7Uoaei l 


nt+ i / aa 


aecaiage + non sens 


ISO 


cxoii y 


izwaeiij 


DTP J. T „« 

r 1 t o aa 


decalage + non sens 


JOoO 


exon 9 


I340ael5 


r + 35 aa 


decalage + non sens 


OZj 


exon 9 


i jHuaeio 


r ic + 33 aa 


decalage + non sens 


a 
A 


exon i x 


io zuaen 


rlL + / aa 


decalage + non sens 




exon iz 


l j /4aeivrvj 


pic + z aa 


decalage + non sens 


J ZOO 


exon 13 


l o34aeizz 


rlL + 1!$ aa 


decalage + non sens 




exon 14 


iOo^-ioo^insi i 


r 1 L- + y aa 


decalage + non sens 


645 


exon 14 


ioojaei4 


PTC + 7 aa 


decalage + non sens 


029 


intron4 


808-2 a h->g 


? 


mutation site d'epissage 


162 


intron 6 


1 129+2 t h-»g 


0 


mutation site d'epissage 


125 


intron7 


1223+1 gh^t 


? 


mutation site d'epissage 


143 


intron 8 


1299+1 gn-»a 


? 


mutation site d'epissage 


1620 


intron 1 1 


1538+5 gna 


(PTC + 6 aa) 


perte de l'exon 11 + decalage 


1006 


intron 11 


1538+3 del4 


? 


mutation site d'epissage 


1605 


intron 13 


1661+1 gnt 


? 


mutation site d'epissage 


1012 


intron 13 


1662-2 a h^t 


? 


mutation site d'epissage 


1626 


intron 15 


1812+1 gi->a 


? 


mutation site d'epissage 


2992 


intron 15 


1813-2 a h->g 


A aa564 h-> aa576 (PTC+7 aa) 


perte de l'exon 16 + decalage 


5226 


intron 15 


1813-2 a h-^g 


A aa564 v-> aa576 (PTC+7 aa) 


perte de l'exon 16 + decalage 


5330 


intron 15 


1813-2 a h->g 


A aa564 h-» aa576 (PTC+7 aa) 


perte de l'exon 16 + decalage 


1611 


intron 16 


1853+1 gHa 


? 


mutation site d'epissage 



"Ls positions en nt font reference a la sequence de I'ADNc SPG4. b L s positions en aa 
font reference a la sequence de la spastin. Les bases des exons sont indiquees en 
majuscules, celles des introns en minuscules. PTC+n aa - "premature termination codon" a n 
acide amine en aval de la mutation. 
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Exemple 5 : Analyse de la sequence proteique de la spastin 

La phase ouverte de lecture de SPG4 code pour une proteine de 616 aa que 
nous avons nommee spastin et dont le poids moleculaire est d'environ 67,2 kDaltons 
(kD). La comparaison de cette sequence en acides amines dans les bases de donnees 
5 proteiques a Taide des programmes BLAST a permis de mettre en evidence une zone 
de forte homologie avec plusieurs membres de la famille des AAA a rextremite C- 
terminale de la spastin. Les motifs « types » de la famille des AAA, englobes dans la 
cassette AAA, sont localises entre les positions aa342 et aa599 (voir Fig. 2) d'apres les 
comparaisons de sequence dans les bases de donnees de domaines proteiques 

10 ProDom et Prosite. Les trois domaines types conserves, dont les motifs A t B de 
Walker ainsi que le motif consensus minimal des proteines AAA sont respectivement 
situes au sein de la cassette AAA aux positions aa382-389, aa437-442 et aa480-498 
(Fig. 2). Le motif A de Walker, « GPPGNGKT » appele egalement p-loop (ou boucle-p) 
qui correspond au domaine de fixation de I'ATP et le motif B « IIFIDE » sont tres 

15 conserves entre tous les membres de la famille des AAA incluant la spastin. 

La comparaison des cassettes AAA presentes dans 150 proteines de cette 
famille d'ATPase issues d'organismes tres eloignes dans revolution a permis de 
classifier cet ensemble de proteines en plusieurs sous-groupes, en fonction du nombre 
de cassettes AAA identifies (1 ou 2) et des homologies de sequence entre ces 

20 differentes cassettes (23). Parmi toutes les proteines de ta famille des AAA, la spastin 
presente une plus forte homologie avec une sous-classe particuliere des AAA, et plus 
specifiquement avec les proteines suivantes dont la plupart ont ete identifiees grace au 
sequencage complet du genome de Porganisme considere : deux proteines de 
Caenorhabditis elegans 016299 et Q18128, deux sous-unites du proteasome 26S de 

25 Saccharomyces cerevisiae Yta6p (Q02845) et TBP6 (P40328) (21), une sous-unite du 
proteasome de Schizosaccharomyces pombe (O43078), les proteines SAP1 (P39955) 
et END13 (P52917) de S. cerevisiae et la proteine murine SKD1 (P46467) (22). 
L'alignement multiple de ces 8 proteines avec la spastin est represents sur la Fig. 4A. 
Sur les 257 acides amines englobant la cassette AAA (positions aa342-599), la spastin 

30 presente une identite de sequence de 52 % t 51 % et 50 % avec la proteine de levure 
Yta6p (Q02845), la proteine de nematode 016299 et la proteine de levure TBP6 
(P40328) respectivement. Des resultats similaires ont ete obtenus par ('analyse de la 
sequence proteique de la spastin dans la base de donnees ProDom qui a montre 
I'existence de trois domaines d'homologie (nommes 92, 179 et 6226 et correspondant 

35 aux positions aa342-409, aa41 1-509 et aa512-599) trouves dans les sous-unites 
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putatives du proteasome 26S de levure. En outre, les membres d ce sous-groupe des 
AAA contiennent le plus souvent des motifs de type leucine-zipper dont deux ont pu 
etre detectes dans la sequence proteique de la spastin aux positions aa50-78 et 
aa508-529 par Panalyse de la sequence dans la base de donnees Pros'rte (voir Fig. 2). 
5 Cette analyse a Sgalement pu predire la presence d'un motif de dimerisation de type 
helice-boucle-helice (« helix-loop-helix ») situe entre les positions aa478 et aa486. 

La comparaison de la sequence proteique de la spastin avec eel les des 
m&tafloproteases mitochondriales comme les proteines de levure AFG3, RCA1 et 
YME1, ainsi que la paraplegin qui est impliquee dans une forme rare de PSF-AR 

10 montre que Thomologie entre ces cinq membres de la famille des AAA est limitee a la 
region de 257aa englobant la cassette AAA (Fig. 4B). Dans cette region, I'identite de 
sequence entre la spastin et la paraplegin n'est que de 29 % alors que la paraplegin et 
la proteine de levure AFG3 sont identiques a 57 % sur cette meme portion de la 
sequence proteique. Cette comparaison de sequence suggere que la spastin 

15 n'appartient pas au meme sous-groupe des AAA que la paraplegin et autres 
metalloproteases mitochondriales. De plus, I'analyse informatique de la sequence de la 
spastin avec le programme PSORT II qui permet de predire la localisation sub- 
cellular des proteines semble indiquer que le spastin est une proteine nucleaire. Un 
eventuel signal de localisation nucleaire (NLS pour « Nuclear Localization Signal »), 

20 RGKKK, a ete mis en evidence entre les positions aa7 et aa11 alors qu'aucun peptide 
signal caracteristique d'un import dans la mitochondrie n'a pu etre decele, 
contrairement a ce qui avait ete observe pour la paraplegin. 
Exemple 6 : Profits d'expression de SPG4 et de son ortholoque murin Spq4 

La comparaison de la sequence nucleique de SPG4 dans les banques de 

25 donnees d'EST a permis de detecter plusieurs ESTs humains, murins et de rat 
presentant une forte homologie avec SPG4. Les clones d'ADNc de blastocyste et 
d'embryon E8 de souris correspondant a deux des ESTs murins, AA560327 et 
AA107866, ont et6 obtenus du consortium IMAGE et sequences integralement. 
L'assemblage des sequences de ces clones d'ADNc a permis de reconstituer une 

30 sequence consensus de 1689 pb incluant une phase ouverte de lecture incomplete de 
1514 pb. La comparaison entre I'ADNc SPG4 humain et cet ADNc de souris a montre 
qu'il manque au transcrit murin environ 460 pb a Textr^mite 5' dont le codon d'initiation 
de la traduction. La phase de lecture ouverte de souris est suivie d'une region 3' non 
codante (3* UTR) de 175 pb contenant un site de polyadenylation situe a -20 pb en 

35 amont de la queue polyA (Fig. 5). La sequence nucleique de SPG4 et la sequence 
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proteique de la spastin humaine presentent respectivement une identite de 89 % (entre 
les positions nt 460 et nt 1982) et de 96 % (entre les positions aa113 et aa616) avec 
les sequences de I'ADNc et de ta proteine deduite de la souris. Ce degre important 
d'homologie permet d'affirmer que ce transcrit de souris correspond a I'orthologue 
5 murin de SPG4, qui a ete done baptise Spg4. 

L'hybridation de northern blots comprenant les ARNm de divers tissus humains 
et murins (Clontech) avec les clones d'ADNc SPG4 et Spg4 n'a pas donne de r6sultats 
probants excepte une tres faible bande correspondant a un transcrit de 2,5 kb dans le 
testicule de souris apres 10 jours d'exposition. En raison du faible niveau d'expresston 

10 de ce gene, les profils d'expression de SPG4 et Spg4 ont ete determines par des 
experiences de PCR sur des collections d'ADNc normalisees provenant de divers 
tissus adultes et foataux (voir Fig. 6). Le gene murin Spg4 est exprime d facon 
ubiquitaire dans les tissus adultes de souris ainsi que du stade E7 au stade E17 de 
Pembryon de souris (Fig. 6A). Une plus forte expression de Spg4 a ete d§tect£e dans 

15 le foie, le muscle squelettique et les testicules, ainsi qu'au stade E15 de I'embryon. 
L'expression precoce de Spg4 au cours du developpement embryonnaire a ete 
confirmee par la presence d'ESTs provenant de banques d'ADNc de blastocyste, 
d'embryon E8 et de carcinome embryonnaire dans les banques de donnees publiques 
d'ESTs. Le gene humain SPG4 est lui aussi exprime de facon ubiquitaire dans les 

20 tissus adultes (Fig. 6B) et fcetaux (Fig. 6C), avec une expression peut-etre plus 
marquee dans le cerveau total. 

Exemple 7 : Pas de defaut de la phosphorylation oxvdative dans la PSF-AD liee au 
locus SPG4 

Afin de determiner si des mutations de la spastin induisaient un defaut de la 
25 phosphorylation oxvdative (OXPHOS) dans la mitochondrie, a ('image de ce qui avait 
ete observe pour la pa rap I eg in, une biopsie musculaire a ete realisee sur un patient 
d'une des families de PSF-AD liee au locus SPG4. Les analyses morphologiques et 
histo-enzymatiques de cette biopsie de muscle n'ont pas revel§ de fibre musculaire de 
type RRF (pour « ragged red fibers »), caracteristique des defauts OXPHOS dans la 
30 mitochondrie. Le fait que toutes les fibres musculaires apparaissent normales ainsi que 
la prediction d'une localisation nucleaire de la spastin semblent indiquer que la PSF- 
AD liee au locus SPG4 n'est pas une maladie mitochondriale de type OXPHOS, par 
opposition a la PSF-AR liee au locus SPG7. 
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Par une approche de clonage positionnel basee sur le sequencage d'une region 
de 1 ,5 Mb, nous avons identifie le gene SPG4 (ou SPAST) responsable de la forme la 
plus frequente de PSF-AD, prealablement localise sur les bandes chromosomiques 
2p21-p22. Trente-neuf mutations alterant ou susceptibles d'alterer le produit du gene, 
5 nomme spastin, ont pu etre detectees chez les individus atteints de quarante-et-une 
families de PSF-AD presentant une liaison au locus SPG4. La spastin est un nouveau 
membre de la famille des proteines AAA, dont la localisation semble etre nucleaire et 
qui presente une forte homologie avec les sous-unites du proteasome 26S de levure. 
En depit d'une grande homologie restreinte a un domaine de 230 a 250 aa, dite 

10 cassette AAA, les nombreux membres de cette famille proteique peuvent participer a 
des mecanismes cellulaires tres varies comme le transport de proteines au sein de 
v6sicules, la regulation du cycle cellulaire, la biogenese des organelles, le controle de 
la transcription, .... Toutefois, tous ces mecanismes cellulaires impliquent 
Tassemblage, la fonction ou la degradation de complexes proteiques, ce qui suggere 

15 que les membres de la famille des AAA sont des proteines dites « chaperons ». 
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ggcgggcgga 


tcacgaggtc 


5700 


aggagatcaa 


gaccctcctg 


gacaacatgg 


agaaacccca 


tctctattaa 


aaatacaaaa 


5760 


ttagctgggc 


atggtggcac 


atccctgtaa 


tcccagctac 


tcgggaggct 


gaggcaggag 


5820 


aatcgcttga 


accagggagt 


cggaggttgc 


agtgagccga 


gatcg caeca 


ctgcactcca 


5880 


gtctggcgac 


agagcgagac 


tccatcttaa 


aaaataaata 


aattttaaaa 


aaaactaccc 


5940 


cagcatggtg 


gtgcatgcct 


gtagtcccag 


ttactcagga 


ggctgaggca 


agagggtggt 


6000 


ttgagccagg 


gaggtcaagg 


ctgcagtgag 


ctctgatggc 


gccactgtac 


tccagcttgg 


6060 


gtgacagagt 


gagaccttgt 


ctcaaaaaca 


aaaacaaaaa 


caaaaaacca 


acaaatctcc 


6120 


ttgttagtat 


catggtgagt 


aaaaaataaa 


ataaaaatag 


aaataaactg 


aacatggtgg 


6180 
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ctcatgcctg 


taatcctagc 


actttggaag 


gctgaagtgg 


gagga t tgc t 


uy ciy gy cuy y 




agttcaaaac 


tggcttgggc 


aacacggtga 


gagagacctt 


gtctctacaa 


aagaact t t t 


DJUU 


aaaacaaaaa 


atagataatt 


taaaaaaatt 


aaaaaaaaca 


aaaaataaaa 


aaataatcaa 


COCA 


gtatcaactt 


gattccaggc 


actgcttact 


actctagtgt 


tatactgtag 


atgtggaagc 


6420 


tgagtaactc 


atccaagatc 


accgaaagtg 


atggaacaca 


gatctaaatg 


caaccagtct 


£ a o n 


gactccagga 


ccatttaacc 


attctactat 


tgggccctat 


cttggctaag 


ttaga^agta 


D04 U 


agttactttc 


tttagtggta 


aagactggag 


ggataacagg 


gaagatagtt 


a, 4— 4W 4~ >v 4 a a 

atutaagaaa 


oouu 


aaaaactggc 


atcaaactaa 


atatccatca 


atagttgaac 


agtaaaatag 


gttgtggtaa 


c cc ft 
bobU 


attcatataa 


tggaatacta 


tatagcagtg 


aaaatgtacc 


acagtta tag 


aaatcaacag 




ggaggaattt 


caacacttaa 


ttattaagta 


ggtagccagg 


catagcggtt 


latyCCtgud 


D/OU 


atcccagcac 


tttgggagac 


caagacagga 


ggattactxg 


agcccagggg 


4— 4— 4 -3 4V y-* ^ 

t tcgaga tea 


K>0*i u 


acctgggcaa 


cagtgagact 


ccatctctat 


tttCtxaaaa 


caaaa taaa t 


gaaa t t t caa 




aaattttgag 


gagggaaagc 


aaacaaggga 


tacttgaaat 


atgattacat 


ttccataaag 


cocn 


tcaaagtgag 


gcaaaatcat 


acaagacatt 


gtttagaaat 


acataaatac 


actgeaaact 




aaaaatgaga 


cactagaatg 


attaatataa 


aattcaggat 


agtggcttcc 


tctagaggaa 


1 UO U 


gagacaagac 


attgagatta 


gggaggagct 


cacagagtgc 


ttcgaggagt 


4* /v4* 4>~ a w 4^* 4-» 

tggt tacax. t 


/ JLflU 


catttttctt 


aaatggaatg 


ctgcttatta 


tttttcttta 


^ 4^ 4" 1 4™" 4 4» 

aattgtgcat 






cacttcttgt 


ttatatgata 


tatgtataaa 


4w 4- _ 4_ 4- 4- -4— 

tgtaattttt 


t tut ctgaga 




# sJ\t 


ctcttgttgc 


ccaggctgga 


gtgcaatggc 


acta tcttgg 


ctcactgcaa 


^* /"^ a 4— 4— m 




ctgggttcaa 


gtgattctcc 


tgcctcagcc 


tcccgagtag 


ctgggattac 


4. *a 4* ^» m «v « 

aggcatgcy c 




caccatgccc 


ggctagtttt 


gtatttttaa 


tagagaaagg 


gt ttc tccat 


g t tgg tcagg 


7 44 ft 


ctggtctcga 


actcccgacc 


tcaggtgatc 


cgcctgcctt 


ggcctcccaa 


ag tg ttggga 


7 *inn 


ttacaggtgt 


gagccaccgt 


gccaggccct 


gaatcagatt 


taaaagaggg 


ca t ttca t ta 


/ D DU 


aaaaaaattt 


tttgttgttt 


gcttttgaga 


cagagtctcg 


ctcfcgtcgcc 


caggcx.gcag 




tgcattggca 


tgatcttggc 


tcaccgcggc 


ctcagcctcc 


caggttcaag 


tga t tctcct 




gcctcagcct 


cgcactagtt 


gagattacag 


gaatgcacca 


ccaccacagg 


aatgcacctg 


7740 


tctaactttt 


gtatttttag 


tatagaggga 


gttttgccat 


gttagccagg 


ctgctcttga 


7800 


actcctgacc 


tccggtgatc 


tgctcgcctc 


ggctcccaaa 


gttctgggat 


tacaggegtg 


7860 


agccaccaca 


cccggccgaa 


agagggcatt 


tcagaatgag 


ggtctagcat 


aagcacagag 


7920 


aagggggagc 


aataagaggg 


aaacagggag 


taggtcattt 


ttgcaatagc 


ctgtgacatt 


7980 
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tgtagggcag 


tactggcggg 


gaataattaa 


gtaaaattgg 


ctggtgctgt 


ggctcatgcc 


8040 


tgtaatccca 


gcactttggg 


aggccgaggc 


gggcaggttg 


cttgagccca 


ggaattcaag 


8100 


accaacctgg 


gaaacatagc 


aagaccctgt 


ctcaacaaaa 


aagtaaaaaa 


attagctggg 


8160 


ggcgcgatgg 


ggtggctcat 


gcctgtaatc 


ccaacacttt 


ggaaggctga 


ggcaggcgga 


8220 


ttgcttgagc 


ccaggagttg 


gagaccagcc 


tgggcaacat 


ggtgaaaccc 


tggctctata 


8280 


aagaatacaa 


aaattagtcg 


ggcccagtgg 


cgtgtgcctg 


tgatcccagc 


tactcgggag 


8340 


gctgaggtgg 


aaggatcacc 


tgagccaggg 


aggtggaggt 


tgcagtgagt 


catgttgttt 


8400 


gcgccactgc 


actccagcct 


gggcaatgga 


gtgaaaccct 


gtccaaaaaa 


taaaaaaata 


8460 


aagctgtggc 


agaatgtgga 


gattcttgga 


agctggaagc 


tctcatgggg 


catttggaaa 


8520 


cctcacattg 


taaataacgg 


agtcttttta 


tcagtttggc 


ttccttagtt 


ttaggaaaca 


8580 


agaaataatt 


atggctaact 


caagtaaaaa 


gagaaagaga 


agagaaaaaa 


gacgtggaga 


8640 


tagagagaga 


gggagagaga 


ggaaaagacg 


aaaggaagga 


agggggaaag 


gagagaggaa 


8700 


gagagaaaca 


gagaaacaga 


ctgattagtg 


tattggatag 


attacataac 


caagtgacca 


8760 


gtcaggaacc 


cagcagctct 


gggggagctc 


aatgtgatgc 


attgataaac 


ccgctcttaa 


8820 


gagcactcgt 


ttccagttac 


tttctattcg 


gtgggtctcc 


agccaagatt 


ccaggtccca 


8880 


ggagaatctg 


actgacctag 


tgtttgcttc 


cgcctttgcg 


gtctgggttc 


tgtgcttgca 


8940 


gctcattaga 


atacagggag 


cagagacaag 


caggtagttt 


cccaaaggaa 


gggatgctga 


9000 


gtagattaaa 


aaaaaagtgt 


agattcttca 


gtaaactatg 


ggatggtaac 


tatgcaaaac 


9060 


ctaagatttc 


ccttattcaa 


ataaattatc 


tttcatatta 


gacatctaaa 


tatgcactaa 


9120 


tttagttaaa 


cccctgggtt 


agttgatctc 


atcacactga 


gctaacattt 


ttgttgctgt 


9180 


tgtttgcagt 


gacctgaagt 


ttcttatctt 


cacaattgct 


ttcctctcaa 


ataattccca 


9240 


gattttaaat 


ttttatttta 


ttttttctgg 


agacggagtc 


tcgctctgtc 


gcccaggctg 


9300 


gagtgcagtg 


gcgcgatctc 


agctcacttg 


cagcctctgc 


ctcccgagtt 


caagcgattc 


9360 


tccggcctta 


gccttccaac 


cagctgggac 


tacaggcgcg 


cgcccccacg 


cccggctaat 


9420 


ttaattccca 


gattgatatc 


cattgcttct 


gagatgggcc 


aattatcctt 


cggagaagac 


9480 


ttaggtcgcc 


tggcagaaaa 


agatgaaaga 


aatctaagaa 


aacgacgaca 


ctgagagagg 


9540 


agcctagcga 


accagcagag 


cgaccccaag 


ccgcaattcc 


cccttccgtg 


gatcgattac 


9600 


gaaggcttcc 


tggcaggagc 


tctccagggc 


tgccgacgtg 


agccgaactg 


cacattggga 


9660 


actgtagttg 


agtgggaaag 


ccgagaggcg 


ggggccgcac 


acgcgtacag 


gggccccggt 


9720 


caacaaagac 


gcgccgtgcg 


cgcgcgcgcc 


ggagaaaaac 


acgggaagac 


gtgcgcgtgc 


9780 
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gcggccgccg 


ctgggagcca 


ccaggcggcg 


gagaggacag 


cgacaggaag 


ggaggggccc 


9840 


gagccaccga 


ctgcaggagg 


agaaggggtt 


gtgctcctgg 


ccgaggaagg 


agaaaggggc 


AAA 

9900 


ggggccggcg 


ggcagcgtgc 


ggcagtgcgg 


agctcctgag 


accggcgggc 


acacgggggt 


9960 


ctgtggcccc 


cgccgtagca 


gtggctgccg 


ccgtcgcttg 


gttcccgtcg 


gtctgcggga 


10020 


ggcgggttat 


ggcggcggcg 


gcagtgagag 


ctgtgaatga 


attctccggg 


tggacgaggg 


10080 


aagaagaaag 


gctccggcgg 


cgccagcaac 


ccggtgcctc 


ccaggcctcc 


gcccccttgc 


10140 


ctggcccccg 


cccctcccgc 


cgccgggccg 


gcccctccgc 


ccgagtcgcc 


gcataagcgg 


*i n o n r\ 

10200 


aacctgtact 


atttctccta 


cccgctgttt 


gtaggcttcg 


cgctgctgcg 


tttggtcgcc 


10260 


ttccacctgg 


ggctcctctt 


cgtgtggctc 


tgccagcgct 


tctcccgcgc 


cct.cat.ggca 


T A. A A A 

10320 


gccaagagga 


gctccggggc 


cgcgccagca 


cctgcctcgg 


cctcggcccc 


ggcgccggtg 


A AAA 

10380 


ccgggcggcg 


aggccgagcg 


cgtccgagtc 


ttccacaaac 


aggccttcga 


gtacatctcc 


"I f\ A A f\ 

10440 


attgccctgc 


gcatcgatga 


ggatgagaaa 


ggtaactagg 


gggctggggg 


agggggcggc 


10500 


ggcgccggga 


agaaggcggt 


ggggtcgccg 


ggggagggca 


acacctgcgt 


cccttttctg 


10560 


cgggagggga 


cggtgcaccc 


ccggaattga 


tatgccccgg 


gagactgctt 


tcccgtaggt 


-1 A /~ A. A 

10620 


cggagcctca 


tcttctagta 


ttcttaaaac 


ctctcccctt 


tcagggcact 


gtagctgtcg 


-» A A A 


actttgtttc 


agacaccagc 


cttcccccac 


acttctgcat 


gacccaggtc 


actatgagac 


10740 


acccagacgt 


gttgatgaca 


gtgacatttg 


tcctagagtg 


accacactga 


tcctttctag 


-1 A A A A 

XUoUO 


cactgtgaag 


agtgtgcagc 


ttcctctgaa 


ccaaggtttc 


caaaaggttt 


tgatattgaa 


t n o c n 


gaagcagtgc 


cgccttactg 


gcttttaatg 


aaagcagagt 


attgtagtgt 


cagaaaaaaa 


i Anon 


gaacaaatgg 


tgacaatttt 


gaaagaaata 


gctgcatatg 


actgcagttg 


aatttgcatc 


1 A. A A A 

1098 0 


attttaatca 


agataatcat 


tttatcagta 


caacgattcc 


tgaatacttt 


ttcaatgaag 


11040 


ttatatttag 


cataaaactt 


ttccccctgt 


tgctttgatt 


ttaattaaaa 


cagtattcca 


i i i n f\ 
111UU 


aagtagcctt 


taatttccaa 


gttgaaatgt 


ttgatgaatg 


gattgcgtaa 


acttaaacat 


11160 


accactttac 


agtaaaacct 


aaaacaacta 


tgtatgtttc 


tgaatgaaag 


caaggatact 




acatctttcg 


ggtttctttt 


aagctaactt 


tttttttttt 


ttgagacgga 


atctcgccct 


112 DU 


gtcgcccaag 


ctggagtgca 


atggtgcagt 


ctcggctcac 


tgcaacctcc 


gactccctgg 


11340 


ttccagcgat 


tctcctgcct 


cagcctcccg 


agtagctggg 


attacaggca 


cgcaccacca 


11400 


cgcctggcta 


atttttgtat 


ttttagtaga 


gtagggattt 


caccatgttg 


gccaggatgg 


11460 


tctccatctc 


ctgacctcgt 


gatcgggtcg 


cctcggcctc 


ccaaagtgct 


ggtaatacag 


11520 


gcatgagcca 


ccgcgcctgg 


ccttaagcta 


acatttttta 


ttatatgtgc 


caggcattgt 


11580 
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gctattagct 


ttgcatgtgt 


tatctttttt 


ctttttaaaa 


aaaatagcaa 


ccatcccaga 


11640 


ccatgaaaag 


tgttatttaa 


tcctcacaat 


aactttgtga 


gatgaaggta 


ttattggtat 


1170O 


cagcatttta 


gagatgaaga 


aaatgaggcc 


caaaagataa 


aggaggttat 


tccaaacctg 


11760 


tgctaataat 


gaaatttctt 


ttatggaaaa 


taagtgaaat 


taggagaagt 


ctaactttta 


11820 


caattctccc 


cttttatcct 


tacttccagt 


atgctgagat 


cttgcttctc 


cctctgccaa 


11880 


aaacacccac 


ttttctacca 


cacctcaatt 


agatactcac 


ttgcattgtc 


cattagtgaa 


11940 


aacagaaaca 


atctgcactt 


cattcatagt 


gtctgtctct 


actgccaact 


ccaaaaactg 


12000 


ttctagaatt 


tcaatcttgt 


tgaaacctgt 


ttcctttgtg 


gggcctggga 


gtgggaagtg 


12060 


ggatataagg 


aaagaggcag 


ttattcattg 


ttttggacag 


taaggaaaga 


gtgacggtta 


12120 


agagaggtca 


aggagggtgt 


taacatttaa 


gaatactatg 


tgtttgtaga 


aggaaatttt 


12180 


ttgttaactg 


ctccattctt 


tttttttttt 


ttttttgaga 


tggagtctcc 


ctgtgtcacc 


12240 


cagactggag 


tgcagtggcg 


tgatctcagc 


ttactgcaac 


ctctgcctcc 


cagacgcagg 


12300 


cgattctctt 


gcctcagtct 


cccgagtagc 


tggaaccaca 


ggtgcgccct 


atcacggctg 


12360 


gctaattttt 


tgtattttta 


gtagagatgg 


tgtttcacca 


tgttggccag 


actggtcacg 


12420 


aactcctgac 


ctcaggtgat 


tcgcctgcct 


cgaccttcca 


agtgcttgga 


ttacaggtgt 


12480 


cagccactgt 


gcccacccag 


caagctccat 


tctttatcac 


ctcttaagaa 


catccaggat 


12540 


cccttgggga 


gaattaaaac 


ggttgcaaag 


ttttagaata 


gaggaacatg 


tttaagcgta 


12600 


gatcattttt 


tgggccagtc 


atggtggctc 


acgcgtgtaa 


tcccaacact 


ttgggaggcc 


12660 


ggggcgggtg 


gatcatgagg 


tcaagagttt 


gagaccatcc 


tggccaacat 


ggtgaaatcc 


12720 


catctctact 


aaaaatacaa 


aaattagctg 


ggcatggtga 


cacatgcctg 


tagtcccagc 


12780 


tactcaggag 


gctgaggcaa 


gagaagtgct 


tgaacctgga 


aggtggaggt 


tgcagtgagc 


12840 


cgagatcgtg 


ccactacact 


ccagcctggg 


cggcagagca 


agactccgtc 


ttgaaaaaaa 


12900 


aaagtaggtc 


atttttggct 


gggcacggtg 


gctcatgcct 


gtaattccag 


cactttggga 


12960 


ggctgaggtg 


ggtggattgc 


ttgagcccag 


gagtttgaga 


ccagcctggg 


caacatagtg 


13020 


aaaccctgtc 


tttgtgaaaa 


atacaaagat 


tagctaggcg 


cagtggcaaa 


tgcctgtagt 


13080 


cccagctact 


tggggggctg 


aggtaggagg 


atcacttgag 


ctcaggttgt 


tcaggctgca 


13140 


atgagctgag 


atcgtgcaac 


tgcactccga 


actgggtgac 


aggagtaaaa 


ctgtctcaaa 


13200 


aaaaaaaaaa 


aaaaaaacca 


aaaaaaaaaa 


aactgtttta 


attgttttat 


ttaggaagag 


13260 


aaagtcagaa 


catgcaagga 


aatttttttt 


atttgtttat 


ttttgagacg 


gagtctcgct 


13320 


cagttgccca 


ggctggagtg 


caatggtatg 


atcttggctc 


actgcaacct 


ctgcctcccg 


13380 
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gattcaagcg 


attctcctgc 


ctcagcctcc 


tgagcagctg 


ggattacagg 


tgtatgccac 


13440 


cacgcccagc 


taatttttgt 


gtttttagta 


gagatggggt 


tccaccatgt 


tggccaggct 


13500 


ggtttcgagc 


tcctgacctc 


aagtgaaccg 


ccctccttgg 


cctcccaaag 


tgctgggatt 


13560 


acaggtgtga 


gccgcggtga 


ccgaccacaa 


ggaaatttta 


gttaacactg 


ttggttgatg 


13620 


ggagttggga 


ggtaggataa 


aaggagaaat 


taaggaaaac 


ctaggcatga 


aaaataaaag 


13680 


accctgagct 


cttagatttg 


aagaaatagc 


agttccatgt 


gaggaataag 


tggaacjaaat 


13740 


agaattcaga 


cctcaggtct 


caggctggtg 


acttaaatct 


ttcagtatca 


catatatgaa 


13800 


tatatctatt 


atacttaaat 


cctcctaaac 


atttttattt 


ttcagttgga 


tatattaaat 


13860 


atataaaaat 


aattatttaa 


tttattttag 


agacagtgtt 


tcactctctt 


acccaagctg 


13920 


gagtggaatg 


tgatcatagc 


tcactgcagc 


ctcaaggctc 


attcctaggc 


ttaagtgatc 


13980 


ctcttttttt 


tttttttgct 


agagatagga 


tcttgttatg 


ttagccaggc 


tggagaaatt 


14040 


tcaacaatat 


tttgaacaat 


aaaaaaaaaa 


taaattaggt 


tttafctgtaa 


agtggtatgt 


14100 


ttaagtttac 


gccattctcc 


tgcgtaatgc 


atatttcata 


ctcttcctac 


tgataatgtt 


14160 


tctgttcaca 


actttttctt 


tatattttga 


tttcttttct 


cttttctttt 


tttttttttt 


14220 


tgagacagag 


cctcgctttg 


tcgcccaggc 


tagagtgcag 


tggcgcgatc 


tcggctcact 


14280 


gctagctccg 


cctcccgggt 


tcacgccatt 


ctcctgcctc 


agcttcccga 


gtagctggga 


14340 


ctacaggcgc 


ccgccaccat 


gcccagctaa 


ttttttgtat 


ttttagtaga 


gacggggttt 


14400 


cactgtgtta 


gccaggatgg 


tctcgatctc 


ctgacctcgt 


gatccacccg 


cctcggcctc 


14460 


ccaaagtgct 


gggattacag 


gcgtgagcca 


ccgcgcccgg 


cacatatttt 


gatttctaat 


14520 


gtggacatca 


gaatgggctg 


ttgacagctc 


tttttttttt 


ttttgaggca 


gagtctcgct 


14580 


tcttcaccca 


ggctggagtg 


caatggcgcg 


atctcagctc 


actgcaacct 


ccacctccca 


14640 


ggttcaagcg 


attctcctgc 


ctcagcctcc 


ccagtaactg 


ggattacagg 


catgtgccac 


14700 


cccacaccca 


gccaattttt 


gtatttttag 


tagagacagc 


atttcaccat 


gttggccagg 


14760 


ctgttctcga 


actcctggcc 


tcaagtgatc 


cactcgcctt 


ggcctcacaa 


actgctagga 


14820 


ttacaggtgt 


gagccaccgt 


gcccagcctt 


gacaggtctt 


tagtttgatt 


ttagttcaac 


14880 


aactgatgcc 


gtaatatgcc 


aaattaaatt 


agttcagact 


gaaacggatt 


acttaaagat 


14940 


tcattttcct 


ttaaaaatga 


agtaaaactt 


tagccggatg 


tggtggcggg 


tgtgtgtaat 


15000 


cccagctact 


cgggagggtg 


aggcaggaga 


atcgcttgaa 


cccaggaggt 


ggaggttgca 


15060 


gtgagctgag 


atctcaccca 


ttgcactcct 


gcctgggtga 


gaagagtgag 


actccatcaa 


15120 


aaaaaaaaaa 


aaaggctggg 


catggtggct 


caagccgggt 


gcagtggccc 


atgcctgtta 


15180 



1 
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tcccagcact 


ttgggaggca 


gaggcaggcg 


gatcacttgt 


agtcagaagt 


tcgcgaccag 


15240 


cctggccaac 


atattagtga 


aaccccgtct 


ctactaaaaa 


tacaaaaatt 


agctgggcat 


15300 


agtggtgcac 


gcctgtagtc 


ccgggtactt 


gggacgctga 


cgcaggacaa 


ttgcttgaac 


15360 


tccagaggtg 


gagattgcgg 


tgggccaaga 


tcacgccact 


gcacgccagc 


ctgggcaaca 


15420 


gagcaagact 


ccatctctca 


aaaaaaaaaa 


aaaaagaaaa 


ctgagtttat 


attgttatgg 


15480 


ttcttatcta 


tcttaaattt 


tttctttagg 


agattgaata 


tttttgtact 


ttagtc'ttaa 


15540 


tccagtggtt 


gaaagagagt 


gcacttttga 


agtctgcctc 


ttggctgtcc 


ttgacaacac 


15600 


aaaccttagt 


tccaagagaa 


tgtaattctt 


cctctttctc 


agtgcttcaa 


aatatatatg 


15660 


atcaaataga 


aacgagttga 


ataggcagtc 


tcttcaaagg 


tttcctaact 


ctgtggttaa 


15720 


ctatcaagga 


gctggtaata 


tcatgcactg 


ccattccctt 


ggcaacatga 


cttatctttt 


15780 


tttttttttt 


ttcttttttg 


agacagagtc 


ttgctctgtc 


acccaggctg 


gagtgcagtg 


15840 


gcgagatctc 


agctcgctgc 


aagccccgcc 


tcccacgttc 


acgccatttt 


cctgcctcag 


15900 


cctcccaagt 


agctgggact 


acaggcgcct 


gccatcacac 


ctggctaatt 


ttttttgtat 


15960 


tttttagtag 


agacggggtt 


tcaccgtgtt 


agccagtacg 


gtctcgatct 


cctgtcctcg 


16020 


tgatccgccc 


accttggcct 


cccaaagtgt 


tgggattaca 


ggtgtgagcc 


actgcgcctg 


16080 


gcctacttat 


cttctaattt 


aactgaaaac 


caatttattt 


gattcagtga 


aatggcatca 


16140 


aactgtagta 


gtgttaattg 


aaatatttgg 


taccttgaaa 


tgttaaatgc 


caaattaaat 


16200 


ctcattttaa 


tgaaatctcg 


tgtaaatgtg 


ttttatatgg 


tgactatgtt 


tattctgaat 


16260 


tttattctta 


tggcatacta 


aaaaaaaaaa 


aaattttttt 


ttttttttgt 


aatggagtct 


16320 


tgctctgtca 


cccacgctgg 


agtgcagtgg 


cgcaatctcg 


gttcactgta 


acctccacct 


16380 


cccgggttca 


agcgattctc 


ctgcctcagt 


ctcccgagta 


gctggtacta 


caggcgtgca 


16440 


ccactatgcc 


tggctaatat 


ttttgtattt 


ttaggagaga 


cagggtttca 


ccatgttggt 


16500 


caggctgatc 


tcgaactcct 


gacctgaagt 


gatccgcctg 


cctcagcctc 


ccaaagtgct 


16560 


gggattacag 


gtatgaccca 


ctgcacccaa 


cccatactca 


aatttgacac 


tgaattttca 


16620 


taaaggcctt 


aatttatctg 


aaaccaaact 


atttcaaaag 


aggaatagca 


cagcaaattc 


16680 


tgttgactta 


atgagaggat 


atgtgaagtc 


tatttattaa 


agcaaatatt 


aattggaggc 


16740 


cagttaattt 


gtacagctct 


gcattttaga 


tatttgagaa 


atatttattt 


cctctccagt 


16800 


gagatgtgtt 


aaaacattag 


ttatgtgatt 


aacaaatatg 


tgtacatacg 


tatatatgta 


16860 


catacacatt 


ttgagacagg 


gccttggtct 


gttgttcagg 


ctggagtgca 


atgacaccat 


16920 


cttagctcat 


tgaagcttca 


gcctcgcagg 


ctcaatcgat 


ccacccacct 


cagcctccct 


16980 
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agtagctggg 


tctacagaca 


tataccacca 


tgcttggctg 


attttttaat 


tttttgLdya 


1 (UiU 


gatggtgatc 


ttgccctgtt 


gactaagttg 


gtaaatatiL 


taattyttga 


s» +■ I - i - C +■ *t" rrrr 


mi on 

J. * J. w u 


aagactgaaa 


acctgtgata 


_ . _. _ *_ A_ A_ X- mm. -m— 

gccattttat 


ataaggagaa 


yCLgaagLtc 


adagogi-aya 




ctcatagcag 


aaacaaaaat 


agaatttaag 


tyaatyyact 


CoaaataLLy 


fartttttac 


17220 


tttatactgc 


aggtttttat 


gttgtaatgc 


tggtaacgag 


-1 4- /-^ 4- 4- /-» /^t a 

ctccttggaa 




17280 


aaaagagaag 


gttgtaataa 


tggttctttg 


gatttactag 


aacatatcat 


4> ^ 4-> /w m a yv 

gtccT-gcatg 


1 T%A fl 
X / j4U 


gctcctgtgg 


gtagacaagc 


cggaaatctc 


ctgggtaaca 


caatggtgga 


ggutccccag 


1 7400 


gtgacgtttg 


atttctcaag 


tacataggac 


taaacagaaa 


aggcctagta 


tgttacatga 


X 1 ft DU 


atgagagatc 


aagtttctca 


ggatattcta 


gggctaaagg 


atcaggcatc 


gaagaCagaa 


1 

X / VJ 


attgtctaaa 


taaaattttt 


tctattcata 


gttttaaagg 


gcnaaagggu 


caggcawLga 


1 7S80 


agacagaaat 


tgtctaagta 


aaatattttt 


ctgttcatag 


t tttaagctg 


cgtataLytg 




catgtgtgta 


tttaaaataa 


cttcgtcaat 


gaaaagagtc 


aaactccgta 


aaataLbtga 


1 7700 


agagatttat 


tctgagccaa 


atatgagtga 


ccagtggccc 


atgacacagc 


CCCagLayaL 


1 7760 


actaagaaca 


tctgtccaag 


gtggtcaggc 


tatagcttga 


6— 4-* +* ^ t* A j"* o 


+- 4- rtrrrta ns» 

LLuayyyoy Q 


17820 


cataagacgt 


cagttaaaca 


tgtaagatgt 


acattggttc 


Cauccggaaa 


nnr*sx /~i n A a A A 
ggCagyaacta 


17880 


ctagaagttg 


gggaggcttc 


caggtcgtag 


gcagattcaa 


agattttctg 


atcggcaatt 


1 7QJ n 


ggtcaaaaga 


gcttatctaa 


agtcctggaa 


tccatagaag 


ggagtgtctg 


gt utaaaata 


1 ftflOO 


ataggttgta 


gctaccaagg 


tttttattgt 


acagatgaag 


cctccaggta 


gcaggct tea 


1 RflfiO 

J.OUDU 


gagagaatac 


attgtaaatg 


tttcttatga 


gactttaaaa 


ggtggcagac 


LCtLaaguta 


1 ftl ?0 


attttctcct 


ggttcaggta 


aaagacttgg 


aaagggaaag 


4 4* 4 

gattctctac 


a^aa eg Uaaa 


18180 

*L W J. W V/ 


ttttccccac 


aagagaaagc 


tttgcagggc 


catttcagaa 


tatgtcaaag 


4~ 4— s s ^ 4~ 


18240 

X O b V 


tagggtaaaa 


tacttcaatt 


tgttttattt 


atttatttat 


^ +^ ^ +■ ^ j"« a FT 4 

tttttgagac 


agag n_.y l- 


18300 


tctgttgccc 


aggctggagt 


gcagtggcat 


gatctcggct 


CaCtgCaag C- 




18360 


gtgttcacgc 


cgttctcctg 


cctcagcctc 


ctgagtagct 


gggacLacag 


g eg c eg y <--*--ci 


18420 


ccatgcccag 


ctattttttt 


tgtattttta 


gtagagacgg 


gatttcacca 


tgutggccag 




gatggtctcg 


atctcttgac 


ctcgtgattc 


acccgcctcg 


gcctcccaaa 


gtgctgggat 


18540 


tacaggcgtg 


agccactgtg 


cccggcctca 


aaatacttca 


atttctttca 


tggectgeta 


18600 


tctgacgtga 


tgctgtacta 


gagtcaggct 


gggaatttgg 


cgtcttattg 


ctacaaaaca 


18660 


tcttaatatc 


tctgttttaa 


tgttaatgct 


gatcagttgt 


ccctgaattc 


caaagggaag 


18720 


agggtatatg 


agtcatgtcc 


aacccccact 


tctcattatg 


gcctgaacta 


gttttttagg 


18780 
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ttaactttgg 


aatgcctttg 


gcaaggggag 


ggtccatgag 


tcagttgggg 


gtcttagagt 


18840 


tttatttttt 


gcttaccggt 


ttataaaaag 


ttaatgaaaa 


ttatcatatt 


tcataattct 


18900 


atataattca 


atattgtact 


ttatttaaaa 


ctcacgtata 


aaatagctgt 


ccatatctgt 


18960 


tttcagaaga 


tgaggatgga 


gggtagaaat 


cagaagtgtc 


agatttggta 


attttcttac 


19020 


actgctgaaa 


acctatacct 


accactttga 


aaggattaat 


ttcagacttg 


ctttctttgg 


19080 


gcctaatgat 


tctactttga 


agtttctctg 


attaaactaa 


ggaataaatc 


tgataaatgg 


19140 


acattcagat 


gataccatac 


ttttccaaaa 


gataacattg 


cttttgatta 


catatgcaat 


19200 


aaacatttca 


cattttttct 


caagattatt 


tactggcatc 


tgcaccaaag 


acacaaaaaa 


19260 


gcagccactg 


ttaaggactt 


tatcccttgt 


tctgttttta 


gctggtttgt 


tgttgtattt 


19320 


ttcctcatgt 


tgaatacagt 


taaaccctat 


taaactggat 


tccccatatt 


actgttagtt 


19380 


gtcctgatga 


caattaagga 


tagttagtaa 


atggatattg 


aatcatttta 


tttttttagt 


19440 


agtgatggcg 


tttcgctgtg 


ttggccaggt 


tggtctcgaa 


ctcctggcct 


caagtgatct 


19500 


gcctgtgttg 


gcccctcaaa 


gtgttaggat 


tacaggcgtg 


agccactgca 


cctggctgga 


19560 


tattgaatta 


ttgaagaagg 


atgttcccta 


acacttcctg 


cctcttttcc 


gctgtcttac 


19620 


tctctctgtt 


ccacccagta 


gtagttgggt 


ttttgatgtc 


tggcaaagta 


tagattgtct 


19680 


actcttctat 


attagttttc 


ttcactcttt 


tttttaaaaa 


tgtttttaaa 


gcaagataga 


19740 


gacagggtct 


tgccgtattg 


cccaggctgg 


tcttgaactc 


ctgagctcaa 


gcaatcctcc 


19800 


cacctcaccc 


cataaagtgc 


ggagattaca 


ggcatgagcc 


accatgcctg 


gccagttttc 


19860 


ttcactcttg 


acctataata 


gtcctgcaaa 


gccagtgaag 


ctgttaatat 


gctgacgtag 


19920 


cctttttttc 


tctcgtttgt 


gaattattaa 


caatcgctga 


tcttacacat 


catatacaat 


19980 


aaaacatctt 


tgaacactgt 


cacatctcag 


cagctcattc 


tggttaatga 


ggaaagaaaa 


20040 


atgtcaaaat 


ctgtgatttt 


cttagaggtt 


attaaatgtt 


ttacagctat 


gtagatattc 


20100 


tgtagacttg 


ctgtacttac 


ttacataact 


tttctgctct 


tctgcagagg 


gagagaatta 


20160 


acttcataag 


tgggctttgt 


caatgccctc 


cagtcagcga 


tctccaggaa 


caaacttatc 


20220 


tatggttgag 


caagtggggt 


ttattaccca 


ctgtagccag 


ggagaacaca 


catatgtaat 


20280 


aaccatggta 


tgtcatagta 


aagggtgtta 


ggaagatagg 


atttgggctc 


gtttatttgg 


20340 


tgattttaag 


gagggtttaa 


agaagcaggg 


ttttgctctg 


atttggatgc 


taccaggagc 


20400 


tgcgaataat 


tctatgaata 


aatatcataa 


aacctatcta 


gaagaaaaga 


ctagagtgag 


20460 


gtctaaagct 


gtagtagtta 


aaaagcaaag 


gtcactcctt 


atctggaaaa 


ggggaatatt 


20520 


tggtatttca 


tggtttagac 


agtgttcagt 


gttcatgttt 


tgcctgtgtt 


tagacataat 


20580 
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tgtagagtgg 


tcttgttcca 


ccgtggtcac 


agagtggcat 


tatttcatgc 


tgatattctg 


20640 


taagtgccag 


gtcaaatacc 


aaggtttagc 


tgatagtagt 


aggccagctc 


ctggatgtaa 


20700 


taagctgttt 


ttctctttct 


cagctttttt 


ttttgttgtt 


ttttttttaa 


aatagagtct 


2O760 


ggctctgtca 


cccaggctgg 


agttcagtgg 


gggcaatctc 


agctcactgc 


agcctctgcc 


20820 


tcctggattc 


aagegactet 


cctgcctcag 


cctcccaact 


agctggaatt 


acaggegcaa 


20880 


gt caeca cac 


ceggctaatt 


tttgtatttt 


tagtagagac 


ggggtttcac 


catgttgagc 


20940 


aggctggtct 


cgaactccgg 


acctcaagca 


atccatctgc 


ctcagcctcc 


caaagtgctg 


21000 


agattacagg 


catgagtcac 


tgcacctggc 


ctgtttctta 


gatttgaggg 


tcaactttta 


21060 


cccttttcga 


actgtggggc 


ttcttatgga 


aattgacatt 


taagtcctga 


ccatatagga 


21120 


tcttgggcaa 


gttacttaac 


tatgtatget 


gagatgtttt 


tttaaatget 


tagtgcttgc 


21180 


acataatagg 


tactcagtaa 


atgagaacta 


ttattataaa 


atcaatagta 


cttttaagat 


21240 


tacagctaga 


ggttatgtta 


gaacattgtt 


aactcttcgt 


actagtttct 


gttacacttt 


21300 


ttaggatgea 


gtagcagcat 


aaacgagata 


tggggaagaa 


cgagaggtat 


ttaaacagtg 


21360 


atataggecg 


ggcgtggtgg 


ctcacgcttg 


taatcccagc 


actttgggag 


gctgaggtgg 


21420 


gcagattacg 


aggtcaggag 


attgagacca 


tcctggctaa 


cacggtgaaa 


ccccatctct 


21480 


actaaaaata 


caaaaacaaa 


attagceggg 


cgtggtagtg 


ggcgcctgta 


atcccagcta 


21540 


tttgggaggc 


tgaggcagga 


gagtggcgag 


aacccaggag 


acagagcttg 


cagtgagccg 


21600 


agatcgcgcc 


actgcacccc 


agcctgggcc 


acagagegag 


actctgtctc 


aaaaaaaaaa 


21660 


aaaaaaaaaa 


attaaaacaa 


aaatatttgt 


gttaattgtg 


atgacaaaaa 


aaaaaaaaga 


21720 


gatggaagtc 


tctccctaac 


ctcactcctc 


atttagtgtc 


atggcttttt 


tctttttttt 


21780 


tttttttttt 


ttgagacaaa 


gcctcactct 


gtcacccagg 


ctggactgca 


gtggtgcaat 


21840 


ctcagctcac 


tgeaggctet 


gcctcccaga 


ttcaagcaat 


tctcctgcct 


cagcctcaca 


21900 


agtagatggg 


actacaggca 


catggcacca 


tgcccagcta 


attttttgtg 


tagtttttag 


21960 


tagagacagg 


gtttcactat 


gttggccagg 


ctggtctcga 


actcctgagc 


tcaagtgatc 


ft f\ f\ A 

22020 


ccccctcctt 


ggcctcccaa 


agtgctggga 


ttacaggcgt 


gagccctgct 


cccagactcc 


22080 


tggctttttt 


tttttttttt 


aatgaaaaat 


teaaaatget 


cttttttttt 


tttttttttt 


22140 


tttgagacag 


agtctcgctc 


tgtcgcccag 


gctgaagtgc 


agtggtgtga 


tctcggctca 


22200 


ctgcaacctc 


tgcctcccag 


gttgaagtga 


ttctcctgcc 


tcagcctctc 


gaacagctga 


22260 


gattacaggt 


acgcgccacc 


acgcctggct 


aatttttgta 


tttttaatag 


agatggggtt 


22320 


ttgtcatgtt 


gtccaggcta 


gecttgaact 


cctcgcctcg 


tgtgatccac 


ctgccttggc 


22380 
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ctcccaaagt 


gctaggatta 


taggcgtgag 


tcgctgcacc 


tggccacaga 


aattttttga 


22440 


agaagataaa 


taaggtgaca 


tttttaaggg 


tcaaagaaaa 


tgtcaaaaac 


tagaatgatg 


22500 


tctttacata 


gggtttaaaa 


ctttccaaat 


taacagggaa 


aataattctt 


taccttgaaa 


22560 


ataaatgttt 


gctagtgaaa 


gcaaatacaa 


tctttttact 


aaatgtttta 


ttaaattttt 


22620 


ttttcttgta 


gacacagggt 


cctactgtat 


tacccaggct 


ggtcttgaat 


gcctggcctc 


22680 


aagcaatcct 


cctacctcag 


tcttccaaag 


tgctgggact 


acagacatga 


gccatcacac 


22740 


tgggtctttt 


ttaccaaatt 


atagtagaaa 


gcactttttc 


tctaatggtg 


aactatgaga 


22800 


gaattaatca 


ggggctatta 


gtaattcatc 


cctgaattaa 


tcagtgatta 


taatgctttg 


22860 


tggtccatgt 


agtttgctgg 


ggattaacac 


accatgaaag 


tctaccagga 


gatttttttt 


22920 


tttctttgag 


aacaggggcc 


ataatcagta 


gtccttaaat 


gaaatggact 


attcccattt 


22980 


cattatatgt 


tgcctaggct 


ggactcgagc 


tccttggctt 


aagtgatctt 


cccacttcag 


23040 


actctcaagc 


agctgggact 


ataggtgtgt 


gccaccatac 


ctggcttaat 


tgagtgtttg 


23100 


ttttttgttt 


ttttttctga 


gacagagtct 


cgttgtgtcg 


cccaggctag 


agtgcagtgg 


23160 


cacaatctcg 


gctcactgca 


acctctgttt 


cccaggttca 


aacgattctc 


ctgcctcagc 


23220 


ctcccaagta 


gctgggatta 


caggcgcctg 


ccaccatgcc 


tggctaattt 


ttgtattttt 


23280 


agtagagatg 


gggtttcacc 


atcttggcca 


ggctgatctc 


gaactcttga 


cctcatgatc 


23340 


cacacacctt 


ggcctcccaa 


agtgctggga 


ttataggcgt 


gagccaccgc 


gcccggcttt 


23400 


aattgagatt 


tttagatatc 


tattactctg 


ctaattttgt 


cacttgcaag 


ttgccatcag 


23460 


aaaattgtag 


gaaaatggat 


atatttgttc 


cttggaatgg 


tttgtgtgag 


aatacttaag 


23520 


gattaaatag 


ataagtaaaa 


ctggtgggct 


ttatataaca 


tagatgagca 


aatgtcagga 


23580 


acatacaact 


gtgcacacag 


ttcaggagaa 


ggaggattta 


agttaatcaa 


caaatttact 


23640 


aagtataata 


aagatactaa 


aagtagtgtt 


tccataccac 


tttattactt 


aaagtatcat 


23700 


catataccct 


attttatatg 


atttttgcca 


caagtcagag 


ttaggtaaaa 


gaaatacttg 


23760 


cttttcaggt 


aaggagtttg 


acgcccagac 


agattaactg 


acttttccaa 


aatcatattg 


23820 


ctattaaatg 


gtggaacaag 


gacttaaatc 


tttgccttct 


aactcacata 


cttgcaaaca 


23880 


catatcctct 


cactctaccc 


caagctaccc 


atgttttgac 


ccttcttgtg 


gcaatctggg 


23940 


tctcactaat 


atttgaaaga 


aaacgtacag 


tagataattt 


gcaagttaat 


ctgttacgca 


24000 


tatctcttac 


ctctatttaa 


agatgaatat 


cagcatttct 


gttgtttcta 


cagtaacata 


24060 


ctaaaaaata 


atgcagtcca 


ggtgcagtgg 


ctcacacgtg 


taatcctagc 


acttttggaa 


24120 


gttgaggcag 


gaggatcact 


tgaagccagg 


agttcgagac 


tagcctgggt 


atgcaagacc 


24180 



ccatttctgt 


tttttttttt 


tgtttgtttt 


gttttgtttt 


gttttgtttt 


tttgagacgg 


24240 


agtctcgctc 


tgtcgcccag 


gctggagtgc 


agtggcggga 


tctcggctca 


ctgcaagctc 


24300 


cgcctcccgg 


gttcacgcca 


ttctcctgcc 


tcagcctccc 


aagtagctgg 


gactacaggc 


24360 


gcccgccact 


acgcccggct 


aattttttgt 


atttttagta 


gagacggggt 


ttcaccgttt 


24420 


tagccgggat 


ggtctcgatc 


tcctgacctc 


gtgatcccca 


tttctttttc 


actgcaacct 


24480 


ttgcctccca 


ggttcaagtg 


attgtcgtgc 


ctcagcctcc 


caagtagctt 


gggattacag 


24540 


gcatgtgcca 


ccatgcctgg 


ctaatttttg 


tattttttgg 


tagagatgga 


gtttctggcc 


24600 


aagctggcca 


ggctggtctc 


gaacgcctag 


cctcaagtga 


tctaccctcc 


ttagcctccc 


24660 


aaagtgctgg 


gattacaggt 


gtgagccact 


gtgcccggcc 


ccatttctac 


aacaattaaa 


24720 


aaatattagc 


ccagtgtagt 


ggtgcatgtc 


tctagtccca 


gctactcaga 


aggctgaagt 


24780 


gaaaggattg 


cttgagccca 


gaatttcaag 


gctacagtga 


gctatgataa 


tggcattgca 


24840 


ctccagcttg 


ggtgacagag 


tgagaccctg 


tctctaaaaa 


atgaagtaaa 


atagtgcaca 


24900 


agtatagaac 


ttgaaaatct 


tccttaacct 


taccataagg 


gaaatgatta 


ctaataagtt 


24960 


tcttaacttt 


ttgtacttac 


ataaacataa 


atattcatca 


gagaaaaaaa 


tatgcaaaac 


25020 


aatttgcaat 


ctttttcact 


taccatattt 


tggaattttt 


ttcatttcaa 


tatatttgat 


25080 


cttccttgtg 


ttttttcagt 


ttgtttgttt 


ttgtcaccca 


ggttggagtg 


aagtggtaag 


25140 


aacatggctt 


attgcagcct 


caatctcctg 


ctcccattca 


gcccctcaag 


tagctgggac 


25200 


tacaggtaca 


tgtcaccacg 


cccggctaat 


ttttattttt 


attttggtag 


agatggggtt 


25260 


tcaccatgtt 


gcccaggctg 


atcttgaatt 


cctgggctca 


agtgacccgc 


ccacctcagc 


25320 


ctcccgaagt 


gttgagagaa 


caggtgtgaa 


ccaccatgct 


ccacctctta 


gtctttacaa 


25380 


tctgcaaaac 


ctcataagtg 


gctaatagag 


gaatatagta 


aagcaaaggg 


ggatatcact 


25440 


gattagaact 


gtgtttttag 


gctgggtgcg 


gtggctcacg 


cctgtaatcg 


caacattttg 


25500 


ggaggctaag 


tgggagtatc 


acttgagccc 


gggagttcaa 


gaccagcctg 


ggcaatatag 


25560 


tgagagaccc 


tgtctttaga 


aaaaaattaa 


ccaggtgtgg 


tggtgcacac 


ctgtggtccc 


25620 


agctattcaa 


gaggctgagg 


tgggagaatc 


gcttaagcct 


aggaggcgga 


ggttgcagtg 


25680 


agatcatacc 


actgctctct 


agcatgggtg 


acagagcgag 


acccagtcta 


aaaaaaaaag 


25740 


tattttttcg 


tttttttcca 


actcatgtac 


acccgccacc 


ccacccctgc 


tttttttttt 


25800 


tctgacattg 


ggtcttgctc 


tgtcacccag 


gctagagtgc 


agtagcacaa 


tcaactcact 


25860 


gcagcctcct 


cttcctggac 


tcaagcagtc 


ctaccacctc 


agcctcccaa 


gtagctggga 


25920 


ccacaggtgt 


gcaccatcat 


gcctggctaa 


tttttgtact 


ttttgtagag 


atagggtttc 


25980 
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accatgtggt 


tcaccatctc 


taactcctgg 


gctcagtcag 


tccacttttg 


cctcggcatg 


26040 


agccactgtg 


tgcagcccac 


gttttttatt 


aatggatatt 


tggattgttt 


ccatctattg 


26100 


tgaataatgt 


ggctatgaac 


attggtctaa 


atatctgttt 


aagtcccggc 


tttcaatact 


26160 


tttggatata 


tacctaggag 


tagaattact 


gaattatatg 


gtaactttct 


gtttaaattt 


26220 


ttgaactgcc 


aacctgtttt 


ccataggggc 


tgcaccattt 


tgcattccca 


ccagcagtgt 


26280 


acaagggttc 


cagtttctcc 


acatttgtta 


tttttcattt 


tttaaaataa 


tagtcatcct 


26340 


aaagggtatg 


aagtggtatc 


tcgttgtgat 


tttgatttgc 


atgtattttt 


ctaatgactt 


26400 


atgatgctca 


gcattttgtc 


atgtacttat 


gtaccatttg 


tgtatcttct 


ttggaaaaat 


26460 


gtctattaat 


gttcttttcc 


cattttttaa 


ttgggttgtt 


tttatgttta 


tcaattttgt 


26520 


aaacatttta 


agctctgcag 


cataactact 


caaccctgtc 


acatggtaag 


attgacccag 


26580 


taaaacttta 


tgtacaaaaa 


taggcagctt 


actagattta 


atcttagtcc 


atagtttgct 


26640 


aaggcatgca 


ttagataatg 


tagttacact 


attggctaat 


aatttaaact 


acaagtggtt 


26700 


gtaagtttct 


gccacccaaa 


ttctttcttg 


atttgatgta 


gtctggttgg 


ttgaatttga 


26760 


gtgttatatg 


gggtcataga 


gttaaaagag 


aaatgtctat 


gagaaactag 


ggactgttgg 


26820 


gagctaatgt 


taaaggattt 


tggaggcctt 


ttgtgcactg 


gagaccattg 


gaagattgga 


26880 


ttttctgcta 


taaatgtatc 


taaaggataa 


tcagtgtaag 


ttatgggctg 


tagtttgcca 


26940 


acccctacat 


taagggattg 


aaataatttg 


aatatgggtt 


tcagttcttg 


tatggtctgg 


27000 


ctcagttctt 


tttttttttt 


tttttttttt 


tttttttttg 


agatggagtc 


tcactctgtt 


27060 


gcccaagctg 


cagtgccatg 


gcacgatctc 


agctcgctgc 


aacctccgcc 


tcctggcttc 


27120 


aagtgattct 


cctgcctcag 


cctccagagt 


agctaggact 


acaggcacgt 


gccaccacat 


27180 


ctggctaatt 


tttttttttt 


tcaagacaga 


gtttcgctct 


tgtcacccag 


cctggagtgc 


27240 


aatggcacga 


tcttggctca 


ccgcagcctc 


cgcctcctgg 


gttcaagtga 


ttctcctgcc 


27300 


tcagcctccc 


aaatagctga 


ggcaacaggc 


gtgcgccacc 


acgcctagct 


aatttttctg 


27360 


tttttagtag 


agatggggtt 


tcaccatctt 


ggccaggctg 


gtctcgaact 


cctgatctca 


27420 


tgatccaccc 


gcctcagcct 


cccaaagtgc 


tgggattaca 


ggcgtgagcc 


acctcacctg 


27480 


gcgttttttt 


gtgtgtgttt 


tcagtagaga 


tggggcttca 


ctgtattagc 


cagaatggtc 


27540 


ttgatctcct 


gacctcgtga 


ttcacctgcc 


tcagcctccc 


aaagtgctgg 


aattataggc 


27600 


atgagccacc 


acgcctggct 


gtggctcagt 


tcttaactgt 


tcattcattc 


agggtcccag 


27660 


ccaaaatctt 


ttgccacagc 


ttctcctggg 


catgctctga 


aattcatttt 


ttgtctgttt 


27720 


agttgcatga 


gtccactgaa 


agctttgctt 


attttctcca 


ccactttcag 


agttcacagt 


27780 
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cacttcaagt 


agacgaggtc 


aggagatcga 


gacca tccty 


gecaacaugg 


L^ auaLLLLy 
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tctctactaa 
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tgaggcagga 
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agatcatacc 


atttcactcc 


agcctgggcg 


acagag tgag 
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aCaCLgtcaa 
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ctttttatat 
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aatgggcttg 
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tcctttctaa 
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tttggaaacc 


CaCtaaLCCC 
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tgtttttaaa 
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actttttttc 


tagtcctctc 


tCtttttttt 


ULLLLttlX.t 
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agggtctctc 


tcagtggtgc 


gacctccctt 


actgcaaccu 
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ctcccuccLg 


rin +* +* r*a a rr^a 

ggtLCoagLo 




gcgattctcc 


tgcctcagcc 


tcccaaatag 


ctgggagtac 


aggcacccac 


ccccacgccc 




agctaatgtt 


tgtattttta 


gtagagattg 


ggtttcatca 


tgti uggccag 
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cccaggtgat 


ccgcctgcct 
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tgagccaccg 


cacctggctc 


tagttctctt 


^« 4" ^ ^ 4* &m 4~ 4— ^3 


4— ^ 4- i 4- — i 4~ 

tauaguaauc 
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tgctgatgtt 


ataatccaag 


cccaaacgga 
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Luy a a lo LLa 


28 620 


tgtttgttaa 


aaatcagatc 


tgctgggcac 


gguggcucaa 
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tgcctgLLaL 
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28680 


tgggaggccg 


aggcaggtgg 


atcccctgag 


atcaggagtt 


cgagaccagc 
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CLgaCCdaCd 


2874 n 


tggagaaact 


ccgtctctac 


taaaaataca 


aaattagccg 


ggcgtggtgg 
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CdCgLgCCLC 


2R r nn 


tcatcccagc 


tacttgggag 


gctgaggcag 


aagaattget 


tgaaccugT-g 


aggeggagge 


9 pR fin 


tccagggagc 


tgagatcgtg 
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ccattgtact 


ccagcctggg 


caacaagagc 


Uada L U LLa L 
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ctcaaaaaaa 


aaaaatcaga 
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otcatatata 
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aatggaagca 


tgtagtatgt 
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agccucctgt 


Af 4- +- /-^ >t ^~ ^~ 
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cataatattt 


29040 


ttgagattta 


tcccttttcc 


tacacaugtc 


dgtagttLg c 




trrrfoaataa 


29100 


tattccacgt 


gtggagatac 
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cacaatttgt 


4* ^ 4~ m 4* 4— 


9 4. a 0 s 4^ 4- 
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tcctgttttt 
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gttattgttg 


ttgttgttgt 


LLaattaatt 


uuLLaaLLLL 




29220 


tggagtcttg 
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ctctgttgcc 


caggctagag 


ugcaguggcg 


CaaLCaCagc 


L lcxl ug L>aaL 


29280 


ctctgcctcc 


ccggttcaag 


tgattctcct 


gcctcagcct 


cccaagtagc 


tgtgattaca 


29340 


ggtgcccgcc 


accacaacca 


gctaattttt 


gtatttttag 


tagagatggg 


atttcaccat 


29400 


gttggccagg 


ctggtcttga 


actcttccct 


ccttggtctc 


ecaaaatget 


gggattacag 


29460 


gtgtgagcca 


ccatgcccat 


cctcctgttt 


ttaaatttta 


tgaataaagg 


tactgtaaat 


29520 


tcatgtacag 


gtcttagaag 


tttgcatttt 


tcttgggtaa 


atatgtagaa 


gaagagattg 


29580 
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ttgactcatg 


tggtaaatat 


atgtttaatg 


tcataagaaa 


ctaccaaact 


gtttttccaa 


29640 


ctgggtgcca 


ttttgtttcc 


taccagcaaa 


cataatgaaa 


ggtccattac 


cctttgtctc 


29700 


gtaatatttt 


ggtattttta 


tgttcttttg 


tttttttgcc 


attcaaaatt 


gggtgcattg 


29760 


ttgtatcttt 


ggattttaat 


ttgtacttcc 


ctaacaacta 


atgatgtgga 


gcatcttttt 


29820 


atacgcttac 


ttgccaatta 


tgtcttaatt 


ctttggcaat 


acttatattt 


gactctgcct 


29880 


actatatata 


tatatatata 


tatttttatg 


ctatatatag 


agtatatata 


ttttta'tact 


29940 


atatatattt 


atatatacta 


tatatattta 


tatatactat 


atatatatat 


atatatatat 


30000 


atattttttt 


ttttttttga 


gatgaagtca 


tgctctgttg 


accaggctgg 


atgcagtggc 


30060 


atgatcttgg 


cttaccgcaa 


cctcaacctc 


tgcctcccag 


gttcaagtga 


ttctcctgcc 


30120 


tcagcttcct 


gagtagctgg 


gactacagac 


acatgccacc 


atgcccggct 


aatttttgta 


30180 


tttttagtag 


aggtggagtt 


tcgccatgtt 


gtccaggctg 


gtcttcaact 


cctgacctca 


30240 


ggtgatccac 


ccgcttcagc 


ctcccaaaag . 


tgctgggatt 


acaggcatga 


cccaccgtgc 


30300 


ccagctggaa 


taagcaatct 


taaaaagcag 


tttgttgatt 


tctggtgaat 


agagaaaatg 


30360 


tgacaaacta 


tgactcaata 


gtttcatttc 


ttttttgttt 


gtttgtttgt 


ttttttgaga 


30420 


cagagtcttg 


ctctgtcacc 


caggctggcg 


tgcagtggct 


cactgcaagc 


tctgcttcct 


30480 


gggttcacgc 


cattctcctg 


cctcagcctc 


cggagtagct 


gggactacag 


gcgcccgcca 


30540 


ccatgcctgg 


ctaatttgtt 


ttttgtattt 


ttagtagaga 


cagggtttca 


ctgtgttagc 


30600 


caggatggtc 


tcgatctcct 


gacctcgtga 


tccacccgtc 


tcggcctccc 


aaagtgctgg 


30660 


gattacaggc 


atgagccacc 


gcccctggcc 


tacttttatt 


tcttaagcat 


atatcttaaa 


30720 


gaaactgcag 


gtatgcatta 


ggggacaggt 


agaaaaatgt 


tacagcattg 


tttgaaatgt 


30780 


tgaaaaactg 


gaaacaacct 


caatatctta 


ataatagaaa 


aaatggttga 


ggctggctgt 


30840 


ggtggttcat 


gcctgtaatc 


ctagcacttt 


tggaggctga 


ggcgggcgga 


tcacctgagg 


30900 


tcgggagttt 


gagtccagcc 


tggccaacat 


ggtgaaaccc 


cgtctctact 


aaaaatacaa 


30960 


aaaattaggc 


aggtgtggtg 


gtgcacacct 


gtaatcccag 


ctacttggga 


ggctgaggca 


31020 


caagaatcac 


ttgagcctgg 


gaaatggagg 


ttgtagtgag 


ccgagatcat 


gcctactgca 


31080 


ctccagcctg 


ggcaatagag 


tgagactccg 


tctcaaaaaa 


aaaaaaaaaa 


aaaaaaaggg 


31140 


aaggagcatg 


ggaatgggaa 


gaggcactaa 


aaaaggaact 


tcttttgtat 


ctgttacatt 


31200 


gtactcattt 


tgtttttaaa 


attttaagcc 


aaatatgaca 


ttgttatcac 


ttttgttgcc 


31260 


actcagaata 


caagtgctat 


tacactattt 


tctataattt 


tccctttttc 


aaactaaaaa 


31320 


acaaaaatac 


atgtaaacag 


gtgttttctt 


tatggaaaac 


aggaaggtga 


gcatccaaat 


31380 
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aattttagtt 


aatttataac 


aaactcttaa 


taatttcttt 


ttcttcttct 


tctttttttt 


31440 


tttttttttt 


tgagtcaggg 


tcttgctctt 


ttgctcaggt 


tagagtgcaa 


tggtacaatc 


31500 


tggtacaatc 


acatcttagt 


gcaacttcta 


cctcttcagc 


tcaagtgacc 


tctctcctca 


31560 


gtcccccaag 


tagatgggac 


cacagatgtg 


tatccccaat 


catggttaat 


ttttaaattt 


31620 


tttggtagag 


ataaaatctc 


accatgttgc 


ccaagctggg 


cttgagctcc 


tgggctcaag 


31680 


cagtcctcct 


gccttggcct 


cccaaagtgc 


tgggattata 


ggcgtgagca 


aactgt%ccc 


31740 


agtcttcata 


aacttttctt 


tacatgtcct 


tatcaagtac 


tttttgagca 


cctactgtca 


31800 


accagccgta 


gtatataata 


ctgataattc 


tataacataa 


gaaattgacc 


tgtttaaggg 


31860 


gatgaatatg 


gttagttatt 


ttcagggtga 


agaaacagaa 


gaatcgggga 


ggtagtacat 


31920 


agtcataagg 


agacggcatt 


tcttagtcac 


tttgtgtggt 


gtttataata 


agacttcatg 


31980 


tggccaggtg 


cggtggctcg 


tgagcgcctg 


taatcccagc 


actttgggag 


gccgaggtgg 


32040 


gaggatcaca 


acaaggtcag 


gagatcgaga 


ctatcctgaa 


caacatggtg 


aaaccccgtc 


32100 


tctactaaaa 


atacaaaaat 


tagctgggtg 


tggtggcacg 


tgcctgtaac 


cccagctact 


32160 


cgggaggctg 


aggcaggaga 


atcgcttgaa 


ccagggagtc 


ggaggttgca 


gtgaaccaag 


32220 


atcgtgccac 


tgcactgcag 


cctgggctac 


agagagagac 


tccatctaaa 


taaataaata 


32280 


aataaataaa 


taaataga ct 


tcgtctgttt 


catcaagagt 


cattgtatta 


tattgatttt 


32340 


gaaatttcaa 


ataataataa 


ggaatagtat 


ggaaattttt 


gtttgattaa 


atggggacat 


32400 


gaggccaggt 


gtggtcactc 


aggcttgtaa 


tcccagcact 


tcgggagacc 


agggcaggag 


32460 


gattacttga 


gcctaggagt 


tcaagaccag 


cctgggcaac 


atggcaagac 


cctatctcta 


32520 


caaaagaaat 


acacaaaaat 


tagctaagtg 


tggtggcaca 


tgcctgtagt 


cttagctact 


32580 


cgggaggcca 


agggaagagg 


atggatcact 


tgagcccagg 


agttggaggg 


tgcagtgagc 


32640 


taggattgtg 


cccctgcact 


ctagtgtggg 


tgacagcaag 


actctgttta 


aaaaaaaaaa 


32700 


aaaatgaggc 


cgggcgcggt 


ggctcacctc 


tgtaatctga 


gcactttgag 


aggccaaggc 


32760 


gggtggatca 


cctgagttca 


agatcagcct 


ggccaacatg 


gtgaaaaccc 


cgtctttata 


32820 


cttaaattac 


aaagattagc 


tgggtgtgat 


ggtgcacacc 


tgtaacccca 


gctactccag 


32680 


aggctgagac 


agcagaatcg 


cttgaacccg 


ggagggggag 


gttgcaatga 


gccgagattg 


32940 


caccactgca 


ctccagccta 


ggtgacagag 


caagactctg 


tctcaaaaaa 


aaaagaaaaa 


33000 


aagtctaaga 


agttaatttt 


cattcagaca 


aatgttcaaa 


aataatagaa 


ataaaacaaa 


33060 


aaattaattt 


tcaaatatgt 


gatttgagta 


taacgatcac 


tttacagaag 


ttattctaca 


33120 


tactttttoa 
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ttatoctaao 
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tt tt fcacrcrfcc 


cttttaaaoc 


t taact fccrfca 


tcaooaatta 


33180 
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atgttttaaa 


ctagttgttg 


ggttcaaaga 


aaatagaaat 


gtgttattaa 


atgccacact 


33240 


tgtaatctca 


tacagcagtt 


ctcatgatgc 


aatcaattgt 


taaataaaaa 


cttcctctag 


33300 


agaggaggta 


cccagcaatg 


aacacattat 


atcagatttg 


aatatgagat 


taaacaatgc 


33360 


tttttgtttc 


attgttattg 


aaatcatatt 


tgtatttttc 


aaaagtatat 


atacttaaaa 


33420 


attcctaaat 


aaaatgtctt 


tctgtaatac 


agcattttag 


gttataagga 


tcaataccat 


33480 


gggctgataa 


gcaaaatagg 


actcacggcc 


ccaaaatgtt 


gataaacatc 


atgaccatat 


33540 


tccccataat 


ggagttacat 


atacacatta 


caatgataaa 


aatactaaga 


agttatatag 


33600 


taatgtttct 


cagacttgtt 


cacaaccctg 


ttttttatgt 


attacctctc 


aaaagcatga 


33660 


tttgcaatat 


ttagtgtact 


cttcatacga 


tctatacaaa 


taatttttta 


ttttaaagca 


33720 


ggacagaagg 


agcaagctgt 


ggaatggtat 


aagaaaggta 


ttgaagaact 


ggaaaaagga 


33780 


atagctgtta 


tagttacagg 


acaaggtaag 


attgtatttg 


tttatagcca 


tcccaaatta 


33840 


tgatatattc 


acatgattgt 


ccagatttca 


gatctattta 


tttatttatt 


tatttttctt 


33900 


tctttctttt 


cttttctttt 


cttttttttt 


tttttttttg 


agacagggtc 


tttcctctgt 


33960 


tacccaggct 


ggagtgcagt 


gatgtgatca 


tagctcactg 


caacctcaaa 


cttctgggct 


34020 


caagtgatcc 


tcctgcctct 


gcttcccatg 


tagctgggac 


cacaggcgca 


cactaccata 


34080 


cttagctaat 


tattattatt 


attattatta 


ttattattac 


tagtttttga 


gacagagtct 


34140 


cgctcttttg 


cccaggctgt 


agtgcaatgg 


tgcaatctcg 


gctcactgca 


atctccgcct 


34200 


cccggattca 


ggctatttat 


tctcctgcct 


gagactcctg 


agtagctggg 


attacaggtg 


34260 


catgccaccg 


tgcccagcta 


atttttgtat 


ttttagtgaa 


gatggggttt 


tgccacgttg 


34320 


gccaggctgg 


tttcgaactc 


ctgatctcaa 


gtgatctgcc 


cacctcagcc 


tcccaaagtg 


34380 


gtgggagtac 


aggcatgagc 


cactgtgggc 


cacacttagc 


taattaaaaa 


aaattttttt 


34440 


gtagagacag 


ggtctcactg 


tgtttctgtg 


actgatctta 


aacttctggc 


ctcaagtgat 


34500 


cctcctgcct 


cagctttcca 


aagttgtggg 


attacaggca 


tgagccactg 


tacccagcca 


34560 


gattgtattt 


atcttaataa 


atgtatttgg 


gccaggcaca 


gtggctcatg 


cctgtaatcc 


34620 


cagcactttg 


ggaggccgag 


gtgggcgaat 


cacctgggat 


caggagttcg 


agaccagcct 


34680 


gatcaacatg 


gagaaaccct 


gtctctacta 


aaaattcaaa 


attagccagg 


cgtggtgtcg 


34740 


cgcacctgta 


attgcagcta 


cttgggaggc 


tgaggcagga 


gaattgcttg 


gacccaggag 


34800 


gcggaggttg 


tggtaagcca 


agatcgcgcc 


attgcactcc 


agcctgggca 


acaagagtga 


34860 


aactctgtct 


cagaaagaaa 


gaaaagcaaa 


acagtatttc 


atttaattaa 


aaatgccttg 


34920 


tattatacca 


gtaagagtaa 


aaaacaattt 


aattaaagta 


tgatatatgc 


tcttttcatc 


34980 
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acttagaatt 


tgaattttaa 


tcttattgaa 


gaggctgttt 


tagttttatt 


tagatatggt 


35040 


tataacaaca 


atattaatat 


ctgtgaccaa 


attggtgcat 


gcatgggcaa 


tgaaaagcta 


35100 


tgttgtgact 


gcagcatggt 


ggatagcatt 


agtaagttag 


cattggttgt 


aaaatgaatc 


35160 


ccaatttcaa 


agattttgaa 


acgtggggaa 


aaaatatttt 


agaccccatg 


aaataagacc 


35220 


tgaaatctat 


gaaataccac 


agtaggttgg 


aaatcatcat 


gagaaactgt 


aactattttt 


35280 


ttttataggt 


attatatgta 


ttctttgaga 


cagggtctca 


ccctgttgcc 


caggctggaa 


35340 


tgctgtgatg 


tggtcacctc 


tcactgcaac 


atccacttcc 


tggggctgaa 


gtgatccttg 


35400 


caactcaccc 


tcccatgctc 


ggctaatttt 


tttttttttt 


tttttaagta 


gagaccagat 


35460 


ctctttatgt 


tgcccaggct 


ggtcttgaac 


tcctgggctc 


aagtgattct 


gctttgtctg 


35520 


cccagagtgc 


tgggattaca 


gaagtgagcc 


acaacacctg 


gcctaaagat 


agtattttta 


35580 


aaatttcttc 


tgttttcttt 


cttttgggta 


tacattttct 


tctttttttt 


aaaaaaaaat 


35640 


ttctgtataa 


agactgtgac 


tccccatgaa 


agtagtttgg 


gtgataattt 


atcgtgaaac 


35700 


aatattagtt 


gggaaatgta 


gatattttaa 


ttaatttttt 


tctttcaggt 


gaacagtgtg 


35760 


aaagagctag 


acgccttcaa 


gctaaaatga 


tgactaattt 


ggttatggcc 


aaggaccgct 


35820 


tacaacttct 


aggtatcaat 


taatgtataa 


tttgatgtgg 


gatgtattgg 


aaatgtgtgt 


35880 


tcaatgaaac 


tttaatttgt 


agaaagaaat 


agatcagtga 


ttgaaaatgt 


ggtccaggct 


35940 


ttttaacata 


aagaaaacgt 


ataacatata 


caaaaacaga 


agagcataat 


ggacttcttt 


36000 


ttttttttga 


gatggacgct 


tgctctgtca 


cccaggctgg 


agtgcagtgg 


cgtgatcttg 


36060 


gctcactgca 


agctctacct 


cccaggttca 


cgccattctc 


ctgcctcagc 


ctcctgagta 


36120 


gctgggacta 


caggcacccg 


ccaccacgcc 


ccgctaattt 


ttttgtagtt 


ttagtagaga 


36180 


cagggtttca 


ccatgttagc 


cagaatggtg 


tccatctcct 


gacctcgtga 


tccacccgcc 


36240 


tcggcctccc 


gaagtgctgg 


agttacaggc 


gtgagccaac 


gcgcccagcc 


gagcataatg 


36300 


aacttctaat 


tattcttctc 


tcagctttga 


taattatcac 


ctcactatca 


gtcttgattt 


36360 


atttatacca 


agggctagca 


aactgcagct 


gatgggccaa 


cccagctcac 


tgcctattac 


36420 


tataaataag 


gttttattgg 


cacacagcca 


ttcctttcct 


ttaggtattg 


tctatggctt 


. 36480 


tcatgctacg 


gtgacagaat 


tgaatagttg 


atacagagac 


aacactgccc 


tcaaaaccta 


36540 


acatatttac 


tgtctggccc 


tgagaaagcc 


tgccatcttc 


acttgacatc 


ccacttcact 


36600 


gtcccccaac 


ttcttattat 


tttgaaacaa 


attattgact 


tattttccat 


ttataaatat 


36660 


ttcatattat 


acctctaaaa 


gataaggatg 


tcaaaataaa 


atcacagaaa 


taccattatc 


36720 


acacctaaaa 


aataactcca 


aatttctttt 


aacattatcc 


aaaaaaactg 


acccccccaa 


36780 
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aatgcaattt 


ccaaatttct 


aattttctca 


aaatttaata 


atttttacta 


ttttttaata 


36840 


atttgtttgt 


atcaggatct 


taaaaagatc 


cgtatgtctc 


ttttaatgta 


caggttcatc 


36900 


tgtttttcat 


tttcttccaa 


tttatttgtt 


gatgaaacca 


ggtctttgtc 


atgtaatatt 


36960 


tcctacagtc 


tgacttttgc 


tgcatgcatc 


ttttgtggta 


tgttttaaca 


tgttcttctt 


37020 


tcctcccacg 


ttaaatgata 


gttggatata 


gagccttgat 


cacattgaaa 


gttgattttt 


37080 


attttttaat 


gattagacta 


cttcctaggt 


ggttgtgttt 


gtgtgttcat 


cattagttgt 


37140 


tccatcttgt 


gaggttagca 


gcagttaact 


atgactgatg 


tccagtgata 


ctttaattct 


37200 


gtcattcttt 


cagcattcat 


caactgtaat 


agaaactttt 


acttgtcttc 


tgtttgatgg 


37260 


cgtaggtttt 


aaatatatat 


taataagtta 


aatctaccac 


tcaaaaaaag 


tagaacaaaa 


37320 


cctactacat 


atgagtggct 


ctaccatacg 


ttggtggatg 


gaaatagtag 


atatttggta 


37380 


agcaggtaaa 


ccttatttat 


ttgtagccct 


gtgacttggg 


gtaagttatt 


ttgcatgtct 


37440 


gggtcttttt 


tatctaattt 


gtaatatgaa 


gctattatta 


ttattattat 


tattattatt 


37500 


attattatta 


ttattattat 


tattcgagat 


ggagtcttgc 


tttgttgccc 


aggctggagt 


37560 


gcagtggtgc 


aatctcggct 


caatgcaccc 


tccacctcct 


gggttcaaac 


tattctcgtg 


37620 


attcagtctc 


ccgagtagct 


aggattacag 


gggcctacca 


ccacacctaa 


tttttgtatt 


37680 


tttagtaggg 


acggggtttc 


accatgttgg 


ccaggctggt 


ctcaaactcc 


tgacatcaag 


37740 


tgatccatcc 


acctcagcct 


cccaaagtgc 


tgggataggc 


cgggcacggt 


ggctaacgcc 


37800 


tgtaatccca 


gcactttggg 


aggccgaggc 


gggtggatca 


cgaggtcagg 


agattgagac 


37860 


catcctggct 


aacacggtga 


aaccccgtct 


ctagtaaaaa 


aatacaaaaa 


actagccagg 


37920 


tgtggtggcg 


ggcacctgta 


gtcccagcta 


cttgggaggc 


tgaggcagga 


gaatggcatg 


37980 


aacccaggag 


gcggagcttg 


cagtgagccg 


agatcatgcc 


actgcactcc 


aggctgggca 


38040 


aaagagcgag 


actctgtctc 


aaaaaaataa 


aataaaataa 


atagataaat 


aataataata 


38100 


aagtgctggg 


attacaggca 


tgagccacca 


cgcccagctg 


aagctaatat 


tattagctaa 


38160 


taataatatc 


tcatattttt 


gaccattgaa 


ttattaaagg 


aacctaaacc 


atagtagtaa 


38220 


gtgctttaaa 


aatgttggtt 


tttatttatc 


tgtttacctg 


actgtcatca 


cctcctttgc 


38280 


ttaggtagaa 


agatatattc 


ataaacacat 


acatatacat 


tttattcatt 


ctttaattca 


38340 


tttactccta 


tatggtcatt 


gtgtttgtgg 


gatttttgcc 


cgcacatagt 


taaaaatgca 


38400 


gccgttactg 


ctttcagatg 


agtaacaagg 


tagtgttccc 


tggcttctgt 


ggctgacagg 


38460 


atttgccttc 


ttcctttcta 


aatggaggtt 


attactgtgt 


cagatataat 


taaatagtgt 


38520 


attaaagttt 


gttgcaataa 


aataattgat 


ggttctaatt 


ggtactttct 


acgtgtttta 


38580 



67 



tctttaaagc 


ttttcagtgt 


atatataaag 


tatatatcat 


acagaataaa 


tttgattgtg 


38640 


gagcattttg 


taacatcttt 


caaaattaat 


aagagttggt 


ttttatgttt 


tgtttgatgt 


3870O 


tatgatatag 


gacattagaa 


gtattaatat 


caattagaga 


ctcatctttg 


aatgtgactt 


38760 


tgtactttct 


tatttgtgtt 


agtagaggag 


agaacaaaaa 


gaagatatgt 


aatgtaatat 


38820 


gaaactaggc 


atttaaagat 


ttaacgtttt 


ggatatttta 


aagttggtgt 


ctgttttcac 


38880 


cctcaaaaat 


gctattacct 


atttatgaaa 


tatctttaaa 


agtgtggagt 


ggtagatggg 


38940 


aaaggtgaca 


tcggctgggc 


gcggtggctc 


acacctataa 


tcccagcact 


ttgggaggcc 


39000 


aaggtgggcg 


gatcacctga 


ggtcaggagt 


tcacgaccag 


tctggtaaca 


tggtgaaacc 


39060 


taatctctac 


taaaaataca 


aaaaattagc 


caggctggtg 


gtacgcacct 


gtaatcccag 


39120 


ctactcagga 


ggctgagtca 


ggaggatggc 


ttgaacccag 


aaaatggagg 


ttgcattgag 


39180 


ccaagatggc 


accactgcac 


tccagactgg 


gtgacagaga 


gagactccgt 


ctcaaaaaaa 


39240 


aaaaaacgcc 


gggcactgtg 


gctcacacct 


gtaatcctag 


cactttggga 


gactgaggcg 


3930O 


agcagatcac 


ttgaggtcag 


gagttcgaga 


ccagctgggt 


gcctgggcaa 


catagtgaaa 


39360 


ccccgtctct 


actaaaaata 


caaaaaaatt 


agccgggcgt 


agtggcgggc 


gcctgtagtc 


39420 


ccagctactt 


gggaggctga 


ggaaggagaa 


tggcgtgaac 


ccgggaggcg 


gagcttgcag 


39480 


tgagccgaga 


tcccgccact 


gcactccagc 


ctgggtgaca 


gagcgagact 


ccgtctcaaa 


39540 


aaaaaaaaaa 


aaaaaaaaaa 


tagccgggca 


tggtggcggg 


cacctctaat 


ctcacctact 


39600 


tgggaggttg 


aggcatgaga 


attgctcgag 


cctgggaggc 


agaggttgca 


gtaagcagag 


39660 


accacaccac 


tgcactctag 


cctggatgac 


agagtgagac 


tttgtctcaa 


aacaaaaaca 


39720 


aacaaaccaa 


accacctctt 


gtccactcct 


aatctccctt 


actgtgtttc 


acttattttt 


39780 


ttcccatata 


tttgtcacct 


tctaataaac 


tgtgtaactt 


attttttatg 


tttattgtgt 


39840 


actatctgtc 


ttctccctgt 


tggaatataa 


actctatgga 


ggagggatcc 


ttgtctatat 


39900 


cccaagtgcc 


tacaacagtg 


tctagcacat 


gctagttacc 


gaataaatat 


ttgccaagtt 


39960 


aatgaagttg 


tttataaccc 


ttggcactat 


acctgataca 


gtgtagggac 


ttaataaatg 


40020 


aatgttaaat 


gaagctatct 


taaaaatata 


tatatatata 


taacagccag 


atacgccaat 


40080 


ttgccgacat 


caaaattaat 


cttttcatct 


attgcaggtt 


ttacagttaa 


gctttgctct 


40140 


aaggttcact 


atcactaaac 


caaaaataaa 


taatatggat 


ggtcttttcc 


catttttaac 


40200 


agagaggcta 


catcctctca 


aaccagtcag 


tattaggaat 


tcccaggatc 


attctctcca 


40260 


ttttccatcc 


fcaattagata 


cctatctggc 


accacatctc 


tgaaaagctc 


caatttttaa 


40320 


ccagcacata 


ataaacaaat 


atgttactat 


taatacacgt 


ttgtacacaa 


gtcattttta 


40380 
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ttgtcttagg 


tatatccact 


cccagacctt 


ctgagttatt 


gaaagacagg 


aatttgtgat 


40440 


gtcacctctt 


ttttcttttt 


tttgagacgg 


agtcttgcct 


tatcacccag 


gccagagtgc 


40500 


aatggcgtga 


tctcggctca 


ctgcaacctc 


tgcctcccgg 


gttcaagcga 


ttatcctgcc 


40560 


tcatcctcct 


gagtagctgg 


gattacaggt 


ggccctagtt 


tgggtttttg 


gttttaaaca 


40620 


ggatggtctc 


ctctttgaga 


agttgccatg 


agttagccat 


gatgatacct 


gggacaataa 


40680 


tggtccacag 


agaagtaaga 


gccaatacaa 


cgccttaaga 


gaaagtacct 


ggtatgtttg 


40740 


tgaagcagca 


aagaggccaa 


tgtgttccag 


caaggagatt 


atagtagaga 


tgaagtcaga 


40800 


gaactcatgc 


ggagagggat 


tgtcacaaca 


cgcagggctg 


taaaggccac 


catgaggact 


40860 


tgagctttta 


ccgcctgtga 


aatggggagc 


agttacaaag 


atttttaaga 


aagcagccca 


40920 


gtgcagtggc 


tcatgcctat 


aatcccagct 


ctttgggagg 


ctgaggtggg 


tggatcacct 


40980 


gaggtcagga 


gttcgagacc 


agcctggcca 


acatggcgaa 


accttgtctt 


tactaaaaat 


41040 


agaaaaatta 


gctgcgtgtg 


gtggccatgc 


ttgtaatccc 


aaatactcgg 


gaggctgagg 


41100 


cagaagaatc 


acttgaaccc 


gggaggcgga 


ggttgcagtg 


agccgaggtt 


gcgccactgc 


41160 


cctccagcct 


gggcaacaaa 


gcgagactcc 


gtctcaaagc 


cagaaaaaaa 


gatttttagg 


41220 


aaaggaatga 


aatactctga 


cttaaatttt 


agaaggatca 


ctctggttgc 


tatgttgcat 


41280 


tatagactct 


aagggtagaa 


ccagggagag 


caattaggac 


actgttacag 


taatctagga 


41340 


gaaaagtgat 


agaggcttgc 


accagggtag 


tatcaggaga 


aatggtaaca 


agtggttgga 


41400 


ttatgattat 


agttgaaggt 


cgaacaacta 


gatttgctga 


tagattggat 


aaaatggtcc 


41460 


tctctttatg 


gatctcataa 


tacagtagga 


gaaacagaca 


cataaatagt 


catcactgca 


41520 


ggatgggtat 


tagaaatatt 


ttgcaagggt 


gtaaaaggtg 


ctaagaaagc 


tttcttgtgt 


41580 


gacaaagctg 


gttaaagaaa 


gaaaagaaag 


cttcctagaa 


gtgaaaccta 


aaatatacac 


41640 


ttagataaat 


gaataaaagt 


tatgaaagaa 


tgtgagggct 


gggcacagtg. 


gctcatacct 


41700 


gtaatcctag 


cactttggga 


ggttgagtcg 


ggggtattgc 


ttgagtccag 


gagtttgaaa 


41760 


ccagcctgga 


cagcgtactg 


agaccccatg 


tctaaattta 


aaaaaaaaaa 


aaatagccag 


41820 


gagtggtgat 


gtgcacctgt 


agtcctagct 


acttacttgg 


gaggctgagg 


caggaggatt 


41880 


gcttgagctc 


aggaggtcga 


gactgcagtg 


agccatgagt 


acaccactgc 


actctagtct 


41940 


gggtgacaga 


gtgagaccct 


gtctcaaaga 


aaatgaaaag 


aaaaagaatt 


tgagaaaaga 


42000 


tatgtcagga 


aaatgtgatg 


acatgaacaa 


atactcaaag 


gcaagaaaag 


catggtgagt 


42060 


aggggagggt 


acaggttgag 


acatgaagtt 


gggattgccg 


aggcgtaaga 


ggtataggca 


42120 


gatcatggat 


ggcctggttt 


gtcataggaa 


ggagcttggg 


ctcttatctg 


tgggcaatgg 


42180 
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gaagccacta 


aagggtttta 


agtagaagag 


tgttatatgg 


taaggttttc 


ctctccagta 


42240 


gatcactcag 


atgactgtgg 


gggttggatg 


tgaggaggta 


aagcagcaaa 


gttactgctt 


42300 


taatttaaat 


cattgattaa 


tctgtacaat 


cctagtcatt 


ccaaaaagaa 


acattagtcc 


42360 


tttaacagaa 


gtgaattggg 


tctgggcgcg 


gtggctcacg 


cctgtaatcc 


cagtactttg 


42420 


ggaggccgag 


gcgggcagat 


cacctgaggt 


caggagtttg 


agacaagtct 


ggccaacatg 


42480 


gcaaaacctt 


gtatctacta 


aaattacaaa 


aattagctgg 


gcatgggggc 


acccacctgt 


42540 


aatcccagct 


attcgggagg 


ctgaggcagg 


agactctctt 


gaacccataa 


ggcagaggtt 


42600 


gcaatgagct 


gaggtcgcac 


cactgcgctc 


cagcctgggc 


gacagagtga 


gactccgtct 


42660 


ccaaaaaaaa 


gaaaaaatat 


tggagcagtt 


tcacagatgc 


tgtttactgt 


tatactgtat 


42720 


gtgtctatga 


ctcctcctcc 


aagaaaaaaa 


aaatgaattg 


gagcaggttc 


acagaagcaa 


42780 


tgtactgtta 


cactgtatgt 


gtctgtttct 


acacatataa 


atctgaattc 


tgtgtacacg 


42840 


aaaagaaatc 


ctatagcttt 


ttattcctag 


ctataaaaac 


taagaatata 


atttctttct 


42900 


ttttattaca 


taatgaatgg 


ttctgttaac 


tttttgttaa 


aatttcattg 


aggggagtat 


42960 


taattcacat 


ttatgtacgg 


atgtctacat 


ttacaaatca 


gtgtattttt 


tgatttatgc 


43020 


ttttactgag 


acaaagggtt 


tctgtctcag 


catggtcatt 


taaagagttt 


atcattgaga 


43080 


aaaatcagat 


gaccaacctg 


ttagctcaaa 


aaaaaaaaaa 


cctccaaggt 


atattgtatc 


43140 


agccagttct 


aggatacaaa 


agccatgcag 


tactttgtgt 


tttgtgccaa 


aaagggtagc 


43200 


tgctatttga 


cctgtcccaa 


aggcatgtgt 


ggttgtaccg 


taaaccaagc 


atggtacctg 


43260 


tttgtcaaac 


tttagaaatg 


aaagtttaag 


agagttaata 


tataggtgct 


gcatttttta 


43320 


tgtattcatt 


gacttgctgg 


tacagaagaa 


aagaatcaat 


tatgattcag 


cacaatactc 


43380 


cacttgggga 


agagagtgca 


gcagtagttt 


agagtgtcag 


ggatcaaact 


gctaccttct 


43440 


tgggcttcag 


ttgctagact 


taagagaccc 


agatcttggg 


aggggttttt 


gttgttattt 


43500 


gatgtggggg 


taaggttgaa 


atactccctt 


ttaattgatt 


aatataaaaa 


ataggtaatg 


43560 


tagacgtatg 


tcacaaaatt 


ttaacaagtt 


tgagtgtgaa 


aagcatccat 


cccattctat 


43620 


gccctggcta 


cccatttccc 


ctccctagag 


gcggctgtta 


ttatcagttt 


ctctgggtcc 


43680 


tttttagagg 


taatcttttt 


gtatgcaact 


gtgcacatgt 


atgtttacac 


aaatggtagg 


43740 


gtattgtata 


tatatacagt 


tactgcagta 


tgcttatttg 


actttgcttt 


attgctttta 


43800 


ttttctgcct 


gacatatgtt 


aatgtggcca 


aatagggcat 


ttcccagaca 


atccttatag 


43860 


tttcattctg 


tgctacttta 


aatgctgttc 


tccttccctg 


aaatgtcctt 


tttttttttc 


43920 


ttttcttttt 


ttttttttga 


gacagagtct 


cgctctgtca 


cccaggctgg 


agtgcagtgg 


43980 
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cacaatctca 


gctcactgca 


acctccacct 


ccccggttta 


agccattccc 


ctgcctcagc 


44040 


ttcccgagta 


gttgggacta 


caggcgcgtg 


ccaccacgcc 


cggatacttt 


tttgtttgtt 


44100 


tgttttagta 


gagacagggt 


ttcactgtgt 


tagccaggat 


cgcctcaatc 


tcctgacctc 


44160 


ctgatctgcc 


tgcctcagcc 


tcccaaagtg 


ctgggattac 


agacgtgagc 


cactgcgcct 


44220 


ggctgtcctt 


tcttttaatc 


ttttcaaatt 


ctagccagtt 


catagcccac 


ttgctctgta 


44280 


aagctttttc 


agtgatcttt 


cttttgtacc 


atgcagtctt 


ttaaaaaatc 


tacagtttta 


44340 


ttataagttg 


ctaattatat 


ttaataaata 


cctaaatggt 


agaaattgat 


tcatttttta 


44400 


atctccgtag 


tgccaggaac 


tgtggctcat 


gtctgtaatc 


cctgcacttt 


gggaggctaa 


44460 


ggcgggagga 


tcgcttaagg 


ccaggagctt 


gagcccagcc 


tgtggaacat 


attgagaccc 


44520 


cgtctctaca 


aaaaataaat 


tagctgggca 


tagtggtgtc 


tgtatgtagt 


gtcaactact 


44580 


caggagactg 


aggcagaagg 


ataacttgag 


ctcagggagt 


tgaggccaca 


gtgagccatg 


44640 


atggtgccac 


tgtacttcag 


cctgggtgac 


agagcaagac 


caagaccgat 


aattatctcc 


44700 


atggtatttg 


ttttggacgt 


attagatatt 


cagtaaatat 


tttctggtga 


tgatagtgat 


44760 


atctaactac 


ctcaggttac 


ctaacctgaa 


taaggcctat 


ttttaacata 


gccattcact 


44820 


tgttaatttc 


tgttattttc 


gtgacttcat 


ttttactaat 


tatattttaa 


aagataattt 


44880 


tatataaatg 


caaaaacttt 


ttatcatgta 


acaatctggt 


aacaccttga 


gtaatttgtc 


44940 


atttcacatg 


cacattttat 


ttgttcatta 


tcttttttct 


ttttgtttat 


tttttctgtt 


45O0O 


ttttaccttc 


tctgttgcat 


agagaagatg 


caaccagttt 


tgccattttc 


caagtcacaa 


45060 


acggacgtct 


ataatgacag 


tactaacttg 


gcatgccgca 


atggacatct 


ccagtcaggt 


45120 


gggtttaggt 


taactaacat 


aaaataataa 


agcttgcatg 


caaagtaaga 


gtcttactta 


45180 


acctgataat 


gttgatttga 


ttttataatg 


gtaggtttaa 


ttgttcatgt 


tttcacaggg 


45240 


ctgtgttgaa 


aatatagtac 


ctttatcatc 


atagtatata 


aacatgcaac 


aagtcaggta 


45300 


tagtcattct 


aaacttgctt 


tatttgcata 


ttttgcaacc 


tctggttttt 


cagattataa 


45360 


aatatgaagg 


tatacattcc 


cgtaagtgat 


taaaataatc 


tttttttctg 


ttgtggcttt 


45420 


tgtgttttta 


tatggatagc 


tatactgatt 


tttttcatga 


aatagtgttt 


tctaagacac 


45480 


attttaattt 


tttatgtatc 


aatttttatt 


gcatatcaat 


tttcatttat 


agtatatgtg 


45540 


aatgtcttat 


agtacttgat 


agaagaaatt 


tgaaacttca 


catagtgagg 


agaaacatta 


45600 


cagtattatt 


tgctatggat 


taactctatc 


cttcataaac 


ttttggatat 


caacttctac 


45660 


agaagattaa 


atgtctttct 


gttttgtttt 


ctttgggtag 


gggactctcc 


atttcttagg 


45720 


ttctctgaca 


tctgagctag 


ctttttgttt 


aattaaaact 


ttttttttag 


ttgacagata 


45780 
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atgtacctgt 


tcatggggta 


cacagtgatg 


ttttgataca 


tatagtatat 


ggtgattaga 


45840 


tcaaggtaat 


tatcatttcc 


atcatcccaa 


acatttatca 


ttccttgtgt 


tggaaacatt 


45900 


cagtattttc 


cttctagcat 


A» i_ _ - A^ - _ A 

ttgaaatgat 


ataatatatt 


atattgttac 


ctataatcat 


45960 


cctgcagtga 


tgtagaacaa 


tggagcttac 


tctttctatc 


tagctatacc 


tttgtatcct 


46020 


ttccctaccc 


ttttcagcct 


_t A_ A_ - * 

ctagtatcct 


ctgttctact 


ttttatttct 


atgagattaa 


46080 


ctttttaaaa 


ataatattct 


- A. A A ■ _ A 

gtgtgtatat 


ataccacatt 


ttctttattc 


attcgtctgt 


46140 


tcttggacac 


ctaggttgat 


J_ j _ A A ± ■ * 

tctgtatctt 


ggctgttgtg 


aatagtgctg 


cagtaaacat 


46200 


ggggtgtaga 


tgtctgttcg 


atatgatgat 


tttctttcct 


ttggataaat 


tcccaatagt 


46260 


gggattggtg 


ggtcatatgg 


A _ ■ 1 _ A- A A 

tagttctgtt 


tgtagttttt 


gaggaacctc 


catactcttc 


46320 


tccatagtag 


ctgtactagt 


ttagattccc 


aaaagtagcg 


tataagagtt 


cactttctac 


46380 


acatcctcac 


cagcatttgg 


tacttttttt 


gtctttttga 


taatagccat 


cctaactggg 


46440 


gtaagatacc 


ttgttgtggt 


tttgatttgc 


atttccctca 


taattaacga 


tgttgagcat 


46500 


tttttcatat 


ctttgttttt 


gacggtccag 


ctagttttat 


tggttacttt 


tttttttttt 


46560 


ttttagcaat 


agtttcatgt 


gcagggctca 


aattatattt 


aatattactt 


ttttcaaatt 


46620 


ataccagaac 


aaccttaggt 


taggctataa 


aacaactgcc 


ttctttttct 


tttggcataa 


46680 


taattatata 


A _ A^ ^ A^ A A A^ A 

tatattttta 


attacacttt 


acgttctagg 


gtgcatgtgc 


acaacatgca 


46740 


ggtttgttac 


A.. i J A_ . ^ 

atatgtatac 


aagtgccatg 


ttggtgtgcc 


gcacccatta 


acttgtcatt 


46800 


tacattaggt 


atatctccta 


atgctacccc 


tcccctctcc 


cctcacccca 


cgacaggccc 


46860 


cattgtgtga 


tgttccccac 


cctgtgtcca 


agtgttctca 


ttgttcagtt 


cccatctgtg 


46920 


agtgagaaca 


tacggtgttt 


ggttttctgt 


ccttgcgata 


gtttgctcag 


aatgatggtt 


46980 


tccagcttca 


tccatgtccc 


tacaaaggac 


atgaactcat 


cctttttgat 


ggctgcttag 


47040 


tattccatgg 


tgtatatgtg 


ccatattttc 


ttagtccagt 


ctatcattga 


tggacatttg 


47100 


cattgattcc 
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aagtctttgc 


tattgtgaat 


agtgccacag 


taaacataca 


tgtgcatgtg 


47160 


tctttatagc 


agcatgattt 


ataatccttt 


gggtatatac 


ccagtaatgg 


gatggctggg 


47220 


tcaaatggta 


tttctagttc 


tagatccttg 


aggaatcgcc 


acactgtctt 


ccacaatggt 


47280 


tgaactagtt 


tacgttccca 


tcaacagtgt 


aaaagtgttc 


ctgtttctcc 


acatcctctc 


47340 


cagcacctgt 


tgtttcctga 


gtttttaatg 


atcgccattc 


taactggtgt 


gagacggtat 


47400 


ctcattgtgg 


ttttgatttg 


catttctctg 


atggccagtg 


atgatgagca 


ttttttcatg 


47460 


tgtcttttgg 


ctgcataaat 


gtcttctttt 


gagaagcatc 


tgttcatata 


ctttgcccac 


47520 


tttttgatgg 


ggttgtttga 


tttttttctt 


gtaaattttt 


ttaagttctt 


tgtagattct 


47580 
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ggatatcagc 


cctttgtcag 


atgggtagat 


tgcaaaaatt 


ttctcccatt 


ctataggttg 


47640 


cctgttcact 


ctgatggtag 


tttcttttgc 


tgtgcagaaa 


ctctttagtt 


taattagatc 


47700 


ccatttgtca 


attttggctt 


ttgttgccat 


tgcttttggt 


gttttaggca 


tgaagtcctt 


47760 


gcccatgcca 


gtgcccatgc 


cagtgtcctg 


aatggtattg 


cctagatttt 


cttctagggt 


47820 


ttttatagtt 


ttagaactaa 


catttaagtc 


tttaatccat 


cttgaattaa 


tttttgtata 


47880 


aggtgtaagg 


aagggatcca 


gtttcagctt 


tgtacgtttg 


gctagccagt 


tttcccagca 


47940 


ccatttatta 


aataggaaat 


cctttcccca 


tttattgttt 


ttgtcaggtt 


tgtcaaagat 


48000 


cacatggttg 


tagatgtgtg 


gtattatttc 


tgagggctct 


gttctgttcc 


attggtctat 


48060 


atctctgttt 


tggtatcagt 


accatgctgt 


tttgattact 


gtaccttcgt 


agtatagttt 


48120 


gaagtcaggt 


agcacgatgc 


ctccagcttt 


gttcttttgg 


cttaggattg 


tcttggcaat 


48180 


gcaggctctt 


ttttggttcc 


atatgaactt 


taaagtagtt 


ttttccaatt 


ctgtgaagaa 


48240 


agtcatttgt 


agcttgatgg 


ggatggcatt 


gaatctataa 


attaccttgg 


gcagtgtggc 


48300 


cattttcatg 


atattgattc 


ttcctatcca 


taagcatgga 


atgttcttcc 


atttgtctgt 


48360 


gtcctctttt 


atttcattga 


gcagtggttt 


gtagttctcc 


ttgaagaggt 


ccttcacatc 


48420 


ccttgtaagt 


tggattccta 


ggtattttat 


tctctttgaa 


gcaattgtga 


atgggagttc 


48480 


actcatgatt 


tggctgtttg 


tctgttattg 


gtgtatagga 


atgcttgtga 


tttttgcaca 


48540 


ttgattttgt 


atcctgagac 


tttgctgaag 


ttgcttatca 


gcttaaggag 


attttgggct 


48600 


gagatgatgg 


ggttttctaa 


atatacaatc 


atgtcatctc 


caaacaggga 


caatttgact 


48660 


ttcttttcct 


aattggatac 


cctttatttc 


tttctcctgc 


ctgattgccc 


tggccagaac 


48720 


ttccaacact 


atgttgaaca 


ggagtggtga 


gagagggcat 


ccctgtcttg 


tgctagcttt 


48780 


caaagggaat 


gcttccagtt 


tttgcccatt 


cagtatgata 


ttggctgtgg 


gtttgtcata 


48840 


aatagctctt 


attattttga 


gatacatccc 


atcaatacct 


agtttattga 


gagtttttag 


48900 


catgaagggc 


tgttgaattt 


tgtcaaaggc 


cttttctgca 


tctattgaga 


taatcatgtg 


48960 


gtttttgtct 


ttggttctgt 


ttatatgatg 


gattacgttt 


attgatttgc 


atatgttgaa 


49020 


ccagccttgc 


atcccaggga 


tgaagccaac 


ttgattgcgt 


tggataagct 


ttttgatgtg 


49080 


ctgctggatt 


cggtttgcca 


gtattttatt 


gaggattttt 


gcgttgatgt 


tcatcaggga 


49140 


tattggtcta 


aaattctctt 


tgttgtgtct 


ctgccaggct 


ttggtatcag 


gatgatgctg 


49200 


gcctcataaa 


atgagttagg 


gaggattccc 


tctttttcta 


ttgattggaa 


tcatttcaga 


49260 


aggaatggta 


ccagctcctc 


tttgtacctc 


tggtagaatt 


cagctgtgaa 


tccatctggt 


49320 


cctggacttt 


ttttggttag 


taggctatta 


attattgcct 


caatttcaga 


gcctgttatt 


49380 
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ggtctattca 


gggattcagc 


ttcttcctgg 


tttagccttg 


ggaggctgta 


tgtgtccagg 


49440 


gatttatcca 


tttcttctag 


attttctagt 


ttatttgagt 


agaggtgttt 


atagtattct 


49500 


ctgatggtag 


tttgcatttc 


tgtggaatcg 


gtggtgatat 


cccctttatc 


atttcttatt 


49560 


gcatctattt 


gattcttctc 


tcttttcttc 


tttattagtc 


ttggtagcag 


tctatcagtt 


49620 


ttgttgatct 


tttcaaaaaa 


ccagctcctg 


gattcattga 


ttttttgaaa 


ggttttttgt 


49680 


gtctctatct 


ccttcatttc 


tgctctgatc 


ttagttattt 


cttgccttct 


gctagdtttt 


49740 


gaaggtgttt 


gctcttgctt 


ctctagttct 


tttaatggtg 


atgttagggt 


gtcaatttta 


49800 


gatctttcct 


gttttctctt 


gtgggcattt 


agtgctataa 


atttccctct 


acacactact 


49860 


ttaaatgtgt 


cccaaagatt 


ctgatatgtt 


gtgtctttgt 


tctcgttggt 


ttcaaagaac 


49920 


atctttattt 


ctgccttcat 


tttcttatat 


acccagtagt 


cattcaggag 


caggttgttc 


49980 


agtttccatg 


tagttgtgtg 


gttttgcgtg 


agtttcttaa 


tcctgagttc 


tagtttgatt 


50040 


gcactgtggc 


ctgagagaca 


gtttgttgta 


atttctgttc 


ttttacattt 


gctgaggagt 


50100 


gctttagttc 


caactatgtg 


gtcaattttg 


gaataggtgt 


ggtgtggtgc 


tgagaagaat 


50160 


gtatattctg 


ttgatttggg 


gtttagagtt 


ctgtagatgt 


ctattaggtc 


cacttggtgc 


50220 


agagctgagt 


tcagttcctg 


gatctgtctt 


gttgatctgt 


ctaatattga 


cagtggggtg 


50280 


ttgaagtctc 


ccagtattat 


tgtgtgggag 


tctaagtctc 


tttgtaggtc 


tctagggact 


50340 


tgctttatga 


atctgggtgc 


tcctgtattg 


ggtgcatata 


tatttaggat 


agttagctct 


50400 


tcttgttgaa 


ttgatccctt 


tagcattata 


tgatggcctt 


ctttgtctct 


tttgatcttt 


50460 


gttggtttaa 


agtctgtttt 


atcagagagt 


tggattgcaa 


accctgcttt 


ttttgttttc 


50520 


catttgcttg 


gtagatcttc 


ctccatccct 


ttattttgag 


cctatgtgtg 


tctctgcacg 


50580 


tgagatgggt 


ttcctgaata 


cagcacactg 


atgggtcttg 


actcgttatc 


caatttgcca 


50640 


gtctgtgtct 


tttaattgga 


gcatttagcc 


catttccatt 


taaggttaat 


attgttatgt 


50700 


ttgaatttga 


tcctgtcatt 


atgatgttag 


ctggttattt 


tgctcgttag 


ttgatgcagt 


50760 


ttcttcctag 


cctcgatggt 


ctttacaatt 


tggcatgttt 


ttgcagtggc 


ttgtaccggt 


50820 


tgttcatttc 


catgttcagt 


gcttccttca 


ggagctcctg 


taagcaggcc 


tggtagttac 


50880 


aaaatctgtc 


agcatttgct 


tgtctttaaa 


ggattttatt 


tctccttcac 


ttatgaagct 


50940 


tagtttggct 


ggatatgaaa 


ctctgggttg 


aaaattcttt 


cctttaagaa 


tgttgaatat 


51000 


tggcccccac 


tctcttctgg 


tttttagagt 


ttctgccaag 


agatcagctg 


ttagtctgat 


51060 


gggcttccct 


ttgtgggtaa 


cccgaccttt 


ctctctggct 


gcccttaaca 


ttttttccta 


51120 


catttcaact 


ttggtgaatc 


tgacaattat 


gtgtcttgga 


gttgctcttc 


ttgagtagta 


51180 




1 1 

74 



tctttgtggc 


attctctgta 


tttcctgaat 


ttgaatgttg 


gcctgccttg 


ctaggttggg 


51240 


gaacttctcc 


tggataatat 


cctgcagagt 


gttttccaac 


ttggttccat 


tctccccgtc 


51300 


actttcaggt 


acacccgtca 


gacatagatt 


tggtcttttc 


acatagtcct 


atatttcttg 


51360 


gaggttctgt 


tcgtttcctt 


ttactctttt 


ttctctaaac 


ttctcttctg 


gcttcatttc 


51420 


attcatttga 


tcttcaatca 


ctgataccct 


ttcttccact 


tgatcgaatc 


ggctactgaa 


51480 


gctcatgcat 


gcatcacgta 


gttttcgtgc 


catggttttc 


agctccatca 


ggccatttaa 


51540 


ggtcttctcc 


atgctgttta 


ttctagttag 


ccatttgtct 


aatctttttt 


caaggttttt 


51600 


agcttctttg 


caatggtttc 


gaacatcctc 


ctttagctcg 


gagaactttg 


ttattaccca 


51660 


tcgtctgagg 


cctacttctg 


tcagcttgtc 


aaagtctttc 


tctgtctagc 


tttgttccgt 


51720 


tgctggtgag 


gagctgtgtt 


cctttggagg 


agaagaggcg 


ctctgaattt 


tagaattttc 


51780 


agcttttctg 


ctctggtttc 


tccccatctt 


tgtggcttta 


tctacctttg 


gtctttgatg 


51840 


atggtgacgt 


acagatgggg 


ttttggtgtg 


gatgtccttt 


ctgtttgtta 


attttccttc 


51900 


taacactcag 


gaccctcagc 


tgcaggtctg 


ttggagtttg 


ctggaggtcc 


actccagacc 


51960 


ctgtttgcct 


gggtatcacc 


agcggaggct 


gcagaacagc 


aaatgttgca 


gaacgacaaa 


52020 


tgttgctgtc 


tgatccttcc 


tctggaacct 


tcgtctgaca 


ggggtaccca 


ggtatatgag 


52080 


gcgtcagtca 


gcccgtatgg 


ggaggtgtct 


cccagttagg 


ctacttgggg 


atcagggacc 


52140 


cacttgagga 


ggcagtctgt 


ccgttcgccg 


atctcaaact 


ccatgctggg 


agaactacta 


52200 


ctctctttag 


agctgtcaga 


cagggacctt 


taagtctgta 


gaagttactg 


ctgccttttg 


52260 


ttcagctatc 


ccatgtcccc 


agaggtggag 


tctacagagg 


cagtcaggcc 


tccttgagct 


52320 


gtggtggact 


ccacccagtt 


caagcttcct 


agctgctttg 


tttacccact 


caagcctcag 


52380 


caatggcaga 


tgcccccgcc 


tccagcctct 


ttgccgcctt 


gcagttcgat 


ctcagactgc 


52440 


tgtgctagca 


gtgagcgagg 


ttccgttggc 


atgggaccct 


ctgagccagg 


catgggatat 


52500 


aatctcctgg 


tgtgccgttt 


gctaagacca 


ttggaaaagc 


ccagtattag 


ggtgggagtc 


52560 


tccctatttt 


ccaggtacca 


tatgtcacgg 


cttcccttgg 


ctaggagagg 


gaattcccca 


52620 


accccttgcg 


cttcccaggt 


gaggcaatac 


cccgcccttc 


agctcacact 


atgtgggctg 


52680 


cacccactgt 


ctgacaatcc 


ccagtgagat 


gaacccagtt 


cctcagttgg 


aaatgcagaa 


52740 


atcagctgtc 


ttctgtgtcg 


ctcacactgg 


gagctgcaga 


ctggagctgt 


tcctatttgg 


52800 


ccatcttgga 


accctgcctt 


cttcattcat 


atgtaataca 


aaacttctaa 


ggttttagtg 


52860 


gagaagagat 


agagtaaaag 


gatttctata 


gacagaagaa 


acagttggtc 


atcaactctt 


52920 


tcccttgtgg 


cttcacatct 


cccctaagga 


cttcttatgt 


tggtttggtc 


ttacagtata 


52980 
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gcctcaacag 


cagattagag 
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tgactttgaa 
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tgcaggtctg 


tagaaattac 


taaattgatg 


actctcacgt 


agcaactttc 


accegtagtt 
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tggtttcata 


tacaatgctt 


taactctttt 


tgctattttt 


tctcttactt 


tctgtgatgg 


54660 


aaacattttg 


tgctttgatt 


ttaatgggtg 


tatcacagtt 


atatacatct 


ttacaaactc 


54720 


atcaaattgt 


atactttatt 


tatatattta 


tttttttttg 


agatagggtc 


tgactctttc 


54780 
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tcccaggctg 


gagtacagct 


gaaattagtt 


gggactacag 


gtgggcacca 


ctgtgccagc 


54840 


taatttttgt 


attttttgta 


gagatggggt 


ttccccatgt 


tggccagtct 


ggtctcaaac 


54900 


tcctgggctc 


aatcatttct 


gccgcctcag 


actcccagag 


tgttgggatt 


ataggtgtga 


54960 


gctactgtgc 


ctggctggta 


tagctttttt 


tttttttttt 


tttttttttg 


tgacagagtc 


55020 


tcactctgtc 


gcccagggtg 


gagtgcagtg 


gcgcgatctg 


ggctcactgc 


aacctctgcc 


55080 


tcccgggttc 


aacccattct 


cctgcctcag 


cctcctgagt 


agctgggact 


acagatgcgt 


55140 


gccaccatac 


ccagctgatt 


tttgtattct 


tagtagaaac 


agagtttcac 


catgttggcc 


55200 


aggatgatct 


cgatctcctg 


acctcgatcc 


acctgccttg 


gcctcccaca 


gtgctggcat 


55260 


tacaggcctg 


agccaccatg 


cctggctgtt 


ggtatacttt 


aaatggatgt 


aattcattgc 


55320 


agattatacc 


tcagtaaatt 


tttatttagt 


ttttgagact 


gagttgctct 


gttgcccagg 


55380 


ctggagtgca 


gtggcacgat 


ttcagctcac 


tgcaacctct 


gcctcctggg 


tttaagcgat 


55440 


tttcctgtct 


cagcctcccc 


ggtagctgga 


attagaggtg 


tgtgccacca 


tgatcagatt 


55500 


atttttgtgt 


ttttagtaaa 


gatggggttt 


caccatgttg 


gccaggctgg 


tctcgaactc 


55560 


ctgacttcag 


gtgatccacc 


cgcctcggcc 


tctcaaagtg 


ctgggattac 


aggtgtgagc 


55620 


caccacgcct 


ggccttaatt 


tttaaatact 


gtaaggctta 


taaagaaaag 


aatattcccc 


55680 


ttctgtttct 


ttcctctcac 


gtagcaacct 


tcacccctag 


tttggtttca 


tatacagtgt 


55740 


tttaactctt 


tttgctattt 


ttttctctta 


ctttctacta 


tatttccaaa 


tacaatgctt 


55800 


ctataatgat 


tccttttttt 


tttctatcag 


tttttgataa 


tcattgactc 


cttatggtca 


55860 


aagaagactt 


aattcccttc 


tgtcactctt 


catatattaa 


tataactaat 


atatatattg 


55920 


tttagttttg 


atataactaa 


aaataactat 


atgtatatat 


aactatatat 


gtataagcta 


55980 


tctgtatata 


gttatatatg 


tatatgcaca 


tacatatata 


gttacatatg 


tatacacaca 


56040 


tacatatata 


gttacatatg 


tatatgcata 


tacatatata 


gttacatatc 


tatatgcata 


56100 


tacatatata 


gttacatatg 


tatatgcata 


cacatatata 


gttacatatg 


tatatgcata 


56160 


tacatatata 


gttacatatg 


tatatgtata 


tgtatataca 


tatatagtta 


tatatgtatt 


56220 


agttatatca 


aaataactat 


gtatatatag 


ctgtaaatgt 


atatataaac 


tatatgtata 


56280 


cagttatata 


tgtatttgta 


tatgtgtgta 


tacatatata 


gttttttttg 


tttttttttt 


56340 


ttgttttttt 


tgtttttttt 


tggagatgga 


gtcttgccct 


gtcccccagg 


ctggaatgca 


56400 


gtggtgctat 


cttggcttac 


cgcaacctct 


gcttcccagg 


ttcaagcaat 


tctcctgctt 


56460 


cagtctcccg 


agtacctggg 


attacaggca 


cgtggcacca 


cgccaggcta 


attttttgta 


56520 


tctttagtag 


aaatggggtt 


tcaccatgtt 


ggccaggctg 


ttctcaaact 


cctgacctcg 


56580 
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tgatccaccc 

tccctataca 

tatgtatatg 

tatagtatat 

tatacactat 

atagtatata 

atatagtata 

gtatactata 

gtatactata 

tatacagtat 

agagtatata 

gtgtgtatag 

actatatcgt 

tacagtatac 

agtatatata 

gtgtatagcg 

tgtatagtgt 

gtatactgta 

tatagtatac 

gtaatatcaa 

agccacgtat 

ttctgatctt 

taatttgctt 

aaactcttag 

tcacctcaac 

gtctgctgtc 

tatatatttt 

agtagtagta 

ctccatctcc 

ggcacacacc 



gcctcggcct 

tatatagtta 

taactatata 

atatactata 

atactatata 

tagtatatat 

catatagtac 

tatagtatag 

tagtatatag 

actatatcgt 

tacagtatac 

agtatatata 

gtgtatagag 

tatatagtgt 

cagtatacta 

tatatataca 

gtatagcgta 

tagcgtatag 

tgtatagtat 

aaaaccatag 

tatatattaa 

tttttttgtt 

tttaactaga 

tctttccagt 

attttggaca 

attctcatac 

taatatatat 

gtagtagtag 

cgggttcaag 

accatgcctg 



cccaaagtgc 

tatataccta 

tatagtatat 

tagtgtgtat 

gtgtatatat 

agtgtatata 

actgtatagt 

tatacatagt 

agtatatata 

gtgtatagag 

tatatcgtgt 

cagtatacta 

tatatataca 

gtatagagta 

tatagtgtgt 

gtatactata 

tatatacagt 

agtatatata 

atagagtata 

ctaagatttt 

tgatattttt 

ctctaacttt 

agacctcctt 

gtctgaaata 

tacctcattt 

ttgttccttg 

acatattttt 

tagtagtagt 

tgattctcct 

gctaattttt 



tgggattaca 

tagttatttt 

atagtatata 

atatagtata 

agtatatgta 

tactgtatat 

atatatagta 

atactatata 

cagtatacta 

tatatataca 

gtatagagta 

tatcgtgtgt 

gtatactata 

tatatacagt 

atagcgtata 

tagtgtgtat 

atactgtata 

tagtatactg 

tatagttaca 

tatgatttag 

tcccttttga 

atattatagg 

tagtagttct 

ccctcatttt 

ccaacaaaca 

tggaaatgtc 

atttatttaa 

agtagtagtt 

gcctcagcct 

gtattttgag 



ggcgtgagca 

tagttatatc 

tatactatat 

tatatagtgt 

gtatatatag 

ataggtgtac 

tagtatatat 

gtatatagag 

tatcgtgtgt 

gtatactata 

tatatacagt 

atagagtata 

tagtgtgtat 

atactatata 

tatacagtat 

agcgtatata 

gtgtgtatag 

tatagtgtat 

tatacatata 

caaaatattg 

gtttttcttc 

tatatactct 

tttagtgaat 

aatgtgacag 

tttgttactt 
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aaatgtataa 

tttttttttt 

cctgagtagc 

tggagatggg 



ccgcgcctgg 

aaaataacta 

agtgtgtata 

atatatcgta 

tatatatagg 

atagtatact 

agtatacata 

tatatataca 

atagagtata 

tcgtgtgtat 

atactatatc 

tatacagtat 

agagtatata 

gtgtgtatag 

actatatagt 

tacagtatac 

cgtatatata 
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gttattttta 
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gtcacttttc 

ctgatagaga 

gtctcagaac 

ttaagttagt 

tagatggagc 

tgggattaca 

gtttcaccat 



56640 

56700 

56760 

56820 

56880 

56940 

57000 

57060 

57120 

57180 

57240 
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57360 

57420 

57480 
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57720 

57780 

57840 
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57960 

58020 

58080 

58140 

58200 

58260 

58320 
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gttggccagg 


ctgatcttaa 


actcctgacc 


tcagatggac 


cacctgcttt 


ggcctcccaa 
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agcgctagga 


ttacaggcat 


gaaccactgc 


gtctggcctt 


aagttattat 
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tgccctgttg 


ctctatcaag 


tagtaggtct 
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58560 


cctgaatgtg 


gctttttttt 


ttttttttcc 
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taaaatttgt 


ttttattttg 


taaaaactaa 


atctctggat 


aaaatcctct 


ataactgact 


61740 


taatgccaaa 


tatagttctc 


tagtgaatac 


agttttacct 


tcaggtaaat 


aaatatacaa 


61800 


tttatggatt 


tttataccct 


ttttcctatt 


tttaaagctt 


gaattctgtg 


aactttaagg 


61860 


ttaacttatt 


tatgaaaagt 


gtaaatgtta 


ggttgtattt 


tcatattaaa 


attttgtatc 


61920 


ctttaagggt 


actccgaaaa 


caaataggac 


aaataaacct 


tctaccccta 


caactgctac 
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tcgtaagaaa 


aaagacttga 


agaattttag 


gaatgtggac 


agcaaccttg 


ctaaccttat 


62 040 


aatgaatgaa 


attgtggaca 


agtaagtttt 


gccatctaaa 


tgttttattt 


tatagttttt 


62100 


atattttaat 


tttacttata 


aaacatgtca 


ggagtgaaat 


agataataaa 


taccttgtct 


62160 


ggtttacata 


cttaattttt 


atgatagttt 


tcaattataa 


atgtagaaaa 


ccattgcttt 


62220 


actgatttaa 


ctatagttta 


acagttaaca 


ttaaaaataa 


ctatatgtca 


tagggcttag 


62280 


gcttcatctt 


gtaataactg 


ggccctgttt 


gtatcgtaga 


actaactgag 


gtcttgtttc 


62340 


ttagtggaac 


agctgttaaa 


tttgatgata 


tagctggtca 


agacttggca 


aaacaagcat 


62400 


tgcaagaaat 


tgttattctt 


ccttctctga 


ggcctgaggt 


aagaacttta 


tattatcatt 


62460 


tttctataat 


accatctgtt 


actgaatcca 


tagtagtagt 


agtagtaaag 


aaatatttga 


6252 0 


gctatactaa 


aataattaat 


tcatataagg 


taacaataga 


tttaatgttt 


taaaaaagat 


6258 0 


aaaacattaa 


caattgatgt 


tgagaagtta 


ttatagaata 


ggaaaatgga 


tatgagttcc 


6264 0 


taatttccaa 


tccttttata 


tttttaggaa 


aagtgggtag 


tatgatataa 


ttttgttttg 


62700 


ttttggagac 


ggagtctcac 


tcattgtgtc 


gcccaggctg 


gagtgcagtg 


gcatgatctt 


62760 


agctcactgc 


aacctctgcg 


tcccagaatt 


caagtgattc 


tcctgcctca 


gcctcccaag 


62820 


tagctgggat 


tacaggcatg 


tgccactatg 


cccagctaat 


ttttgtaatt 


ttagtagaga 


62880 


tggggttttg 


ctatattggc 


caggctggtc 


tttcatacct 


gatgtcaagt 


tatccaccca 


62940 


tttcggcctc 


ccagagtgtt 


aggattacaa 


gtgtgagtca 


ctacatctgg 


ccaaattttg 


63000 


atatcaaggt 


gagagagatt 


taaaattaag 


ataaggtaca 


aaaattagcc 


tagtgtgggg 


63060 


gcgcacgctt 


gtagtcccaa 


ctactgggga 


ggctgtggca 


ggagaattgc 


ttgaaccagg 


63120 


aggcagaggt 


tgcagtgagc 


caagatggca 


ccactgcact 


ccatcctggg 


tgacagagcg 


63180 


agatgtcatc 


tcaaaaacaa 


aacaggccgg 


gtacggtagt 


tcacgcctgt 


aatcccagca 


63240 


ctttgggagg 


ctgaggcggg 


cagatcacga 


ggtcaagaga 


ttgagaccat 


cctggctaat 


63300 


atggtgaaac 


cctgtcttta 


ctaaaattac 


aaaaattagc 


tgggcttggt 


ggtgtgtaac 


63360 


cccagctact 


cgggatgctg 


aggcaggaga 


atcgcttgaa 


cccgggaggc 


ggaggttgca 


63420 


gtgagccgag 


atcacgccac 


tgcactccag 


cctggcgaca 


gagcgagact 


ccgtctcaaa 


63480 


aaaataaata 


aaaatttaaa 


aagataaata 


cataaaaata 


aataaataat 


attaagagaa 


63540 


ggaaatcagg 


caggtagtgg 


cccctgacac 


aatgagtttt 


cccagaattg 


gattgcttgg 


63600 


aaatgccgct 


caaagagtgt 


ggtaaactcc 


atcgaaggct 


aaataccaac 


gtgacagtga 


63660 


taataaacaa 


gtactttatg 


ggaaagtttt 


ttttttaatt 


atttttaaaa 


agagagaaat 


63720 


tgtactggag 


aaaagaggaa 


ttcaggtaga 


ataattcttt 


tttttttttt 


ttttgagatg 


63780 
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gaattttgct 


cctgttaccc 


aggctggagt 


gcagtggctt 


gatgttggct 


cactgcaacc 


63840 


tctgcctttg 


gggttcaagt 


gattctcatg 


cctcatcctc 


ctgagtagct 


gggtctatag 


63900 


gcatgcaccc 


caacacctgg 


ctaatttttg 


tgtttttagt 


agagataggg 


ttttaccatt 


63960 


ttggccaggc 


tggtctcaaa 


ctcctggctt 


cagatgatcc 


gcccaccttg 


gcttcccaaa 


64020 


gtgctgggat 


tacaggcaga 


ggccactgtg 


cctggcatga 


agaacaattt 


ttaaaagaat 


64080 


gacttttaag 


gatattaagt 


catcaaagta 


gatagagcca 


ttaaatgatg 


ggtagaaacc 


64140 


taatcttcca 


tcccatattt 


tatgacttat 


taaggaagat 


aggcaatctt 


gcagttgata 


64200 


ataaatattt 


ggctttccat 


acttagcacc 


gttttgaatt 


tttccagttc 


acagatggta 


64260 


tatttagtgc 


tgttccaata 


atattgcaaa 


aaataaatct 


gaagactcac 


ttctgggtca 


64320 


cagttatttc 


actattaaca 


ttaaaatctt 


acggacctac 


ctgcaacatg 


tagtggaaat 


64380 


aagttgtgtg 


gcacgttgtg 


gtgggtgcat 


tattaaataa 


atgtgcaaag 


gttttatggc 


64440 


tgtctcaatt 


tttccatagt 


cttgagtcat 


tcacatactg 


cctttatggt 


gtttatcact 


64500 


tgtaagtgag 


taccaactgt 


actagaactt 


actgaatatt 


tttcaagtct 


attttactta 


64560 


ttactcattc 


taagtacata 


aaatcactgg 


tctgatatgc 


aagttaggtt 


ttcgctaata 


64620 


cccagtaaaa 


taattagata 


attattaaaa 


tagaaagcat 


ttgtcattat 


gtgaactgga 


64680 


tttatgtcat 


gtaccacctc 


aggtcacact 


ttgggaaacg 


tagcttacgt 


attgagctaa 


64740 


cattttgctg 


gagttatata 


agattagtaa 


atgctataga 


ctaaatattg 


aaaaaaaagc 


64800 


ttgcttaaag 


aggatttaca 


taattgtaga 


cctgaaaagg 


atcttagcag 


tcttctgatc 


64860 


gattcattga 


taaagaaact 


agtcctaaga 


gctaaaatga 


cttgctcaag 


attttagtta 


64920 


agtggtagac 


ctaggaaata 


cctttctaag 


attagagctg 


cctggttagt 


gctatagctg 


64 980 


ccacctaatt 


cttacattta 


tttattaagg 


gacatgcttt 


ttacggtaga 


aaaatatatc 


65040 


taaaattgtg 


aaggtaatac 


caaggaaata 


tttaggctat 


gcaagaaaag 


tcattcagct 


65100 


tttgctttac 


ccaggcctat 


agagaacata 


tctaaaataa 


taagtaacat 


gtgaatttga 


65160 


atttaggcat 


attttcatgg 


tagtgacata 


atgtgcaatt 


aagaagctat 


aataatgtaa 


65220 


aaatgccagt 


tgcaagttat 


ttcaaataaa 


gttgaataac 


ctgacctcag 


gaggggcaga 


65280 


aaccttagta 


aacttagcaa 


actgagacct 


aaggaagagc 


aagatctgtg 


gtagagccag 


65340 


gtctaaaggt 


ttatatcctg 


gtacaaactt 


gtctatacat 


caccacacct 


gccaaatgga 


65400 


actttttttc 


cttgtagttc 


agatttccaa 


gaaagggaat 


attattgtcc 


tagctcagcg 


65460 


tttcacaata 


gactcacaaa 


atgaatcttg 


ttaagcctat 


gaatgggtaa 


gacttatccc 


65520 


ataacacgcc 


tctattgtgt 


aaaaaaatca 


gctttattcc 


taattccctg 


tagtaggaag 


65580 
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cttgcataga 


ccacaataga 


gacattgtta 


gattatatca 


agaaggtgag 


tggcaggcat 


65640 


tcttgagtat 


actggaattt 


ttatttcatt 


gtagaaacac 


agaatcataa 


ttagtcatct 


65700 


aaaactggtt 


ttaaggagat 


aatactaaag 


atactcactt 


gaggtagatt 


gttctcagaa 


65760 


ttacttaaaa 


taagtgcttt 


aaatcttgct 


cattcatgaa 


gccatagccc 


tggaaggaga 


65820 


tattgaaaaa 


cttctccatc 


ttccttcaat 


cccataggac 


catgttttta 


attgtagttt 


65880 


aacattaaac 


ataatttttg 


aaagtagcca 


atattaatct 


ttgacaaaaa 


actcaaacta 


65940 


aatagcagaa 


aatagaacat 


gccctctcct 


ctcgcccaaa 


agtaagacta 


cattttaaag 


66000 


tatatcacag 


tgatctgtct 


aaatattttt 


ctcaaatatt 


ttactaagaa 


agcgtatatt 


66060 


cttctgtcct 


tatttcatag 


atctcttctg 


tatcctgtgc 


agcttgtcta 


tcatttcgag 


66120 


cttttatatt 


tcttattttg 


ttctcttgct 


gcttaaatgt 


gattctttga 


gatttataga 


66180 


agaatgtgat 


tgttctccag 


ttttaaaaag 


ctcttctcta 


tctactaaaa 


tttccatgaa 


66240 


tttctttctt 


tctttttttt 


tttttgattg 


agacagtctc 


gctgtgttct 


ccagcgtggc 


66300 


cttaggctta 


agtgatcctc 


ctgtctcagc 


ctcccaagta 


gctgagatta 


cagaaatttc 


66360 


catgaatttc 


caaatatgat 


gttatctttc 


atataagctt 


aaacataagc 


ctttcttctt 


66420 


tcaaaaatgt 


tagaacttac 


ctctttaaat 


aatcttataa 


agccatttct 


taatttttgt 


66480 


taccttttcg 


aatctattaa 


cttgcatatc 


atagtaaatg 


aacccttagc 


tccatcatac 


66540 


cacacacctt 


ctactcctgt 


cctcccactt 


tttctcaccc 


aggctggagt 


acagtgaata 


66600 


tttagtgctt 


ttaaatatta 


ttcattacca 


agccaagtag 


cgtactattt 


tttccttgta 


66660 


cagccttttt 


ttcccctaaa 


taattgtgtt 


attttttcat 


ttgcttcatt 


ttcatcttat 


66720 


cgattgataa 


ttcttctgtt 


ccatttcagt 


ctaatttcca 


catggccaaa 


ccaatctaaa 


66780 


aacctgttaa 


ctcaggtctt 


tttttttttt 


ttttttccca 


gaataccttt 


tcctggaacc 


66840 


accttcttct 


tttcattcga 


gaccaaatgc 


tttccatgcc 


tgtgtcaaag 


tggttgttct 


66900 


ctaatctgtc 


ttcactacca 


tcataatttc 


cttttccttt 


tttcctttct 


ttattatgta 


66960 


tctcctgtct 


tttaaattcc 


atattttcca 


ctttcatgat 


ttattttctc 


attttgatgg 


67020 


ctacatcttt 


cagtaactga 


gaaaaggttg 


tgtgagggaa 


tattttgaga 


tgctgtagtt 


67080 


ttgaaaatat 


ctttattctg 


ctgtcttctc 


attaataatt 


tgactggatg 


tcaagattta 


67140 


agttggaaac 


tattttccat 


gagtattttg 


aaggcattat 


ctattgtctt 


ctagcttcca 


67200 


gtgctgcttt 


gtattagaga 


cagaagatca 


ggaatcagga 


tagcattgga 


cttcttattt 


67260 


ctatttccca 


aagctttttg 


gatcttctct 


ttattcttat 


cttctgatat 


tttataatga 


67320 


tatgcttgat 


gcatttactt 


tttcttttct 


tcttccctct 


tgtacatttc 


tttctttttt 


67380 
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taggtggggg 


caggggggaa 


ggagtctcac 


tcttctcacc 


caggctagag 


tgcagtggtg 


67440 


caacctcagc 


tcactgcaac 


ctccacctct 


ggggttcaag 


cgattctcct 


gcctcagcct 


67500 


cccgagtagc 


tgggattaca 


ggcatctgcc 


accacgccca 


gctaattttt 


A* Xb X* X* 1 - 

gtatttttag 


67560 


tagagacggg 


a* i> x» x- - ,_ - ■ a_ 

gtttcaggct 


ggtcttgaac 


tcctgacctc 


aggtgatccg 


ccctcctcag 


6762 0 


cctcccaaag 


tgctgggatt 


agaggcatga 


gccactgcgc 


ccagcccctc 


X* X- jw _ _ X- X- x_ 

ttggaccttt 


67680 


ctagatattc 


atccttcaat 


tctgagaaag 


gttctataat 


tctttaattt 


aaaaaaagtt 


67740 


tttttgtttc 


atctttctca 


cttttttttt 


tttttttttt 


ttttaagaca 


j— _ X— — x« X* a* x. 

cagtcttget 


67800 


ctgtcaccca 


ggctggagtg 


cagtggtgcg 


atctcagctc 


actgcgccct 


tcgcctcctg 


67860 


ggttcgagtg 


attctcctgc 


ctcagcctcc 


caagcagctg 


ggattacagg 


tgcccaccac 


67920 


caccatgccc 


ggctaattgt 


tgtattttta 


gtagagaegg 


agtttcacca 


tgttggccag 


67980 


gctggtttca 


aactcctgac 


ctcaggtgat 


ccacctgctt 


tggcctccca 


gagtgctggg 


68040 


attacaggca 


tgagccaccg 


tgcccagccc 


tattctgatt 


teatagatge 


agtgtctttt 


68100 


atgtctctga 


gaggttttgt 


caagttttct 


tttgtttact 


ttattatctg 


tttcttcaag 


68160 


attcctcctc 


ttttcttttt 


gccttaagct 


ttttcatatt 


ggaagcttct 


ctcaaatgtc 


^ o o o n 

do2zU 


tggttattct 


ggttgtccac 


ttatattacg 


tggaacaata 


aaaaagttga 


Xm- X- . H _X- — X- 

ttaggactct 


68280 


gtgctgtaag 


taagtaaatt 


gttgatagtg 


agageccatt 


aatcacagga 


tgatcaagca 


do 34 0 


gcaagcctac 


tgtttatttg 


ggtttctcca 


aatggctata 


gctgtcagtc 


^ x_ x. ^ ^ ^ ^ ^ ^ 

ttttttttct 


68400 


ggggttattt 


ggcttctcta 


gaaaagaatt 


ttctagtctc 


ttgtttggag 


aatacaagct 


68460 


tgactattgg 


tgttccagaa 


aatgggtggg 


aggagacgac 


tttgttttct 


gttaggttga 


68520 


gccatgtgaa 


attactaggt 


tttgttttgt 


tttctgtttt 


gttttgagac 


agagtctcac 




tctgttgccc 


aggctggagt 


gccttagcat 


gatcttggct 


cactgcaacc 


tctgcctccc 


£0 CA ft 


aggttcaagc 


aattctcatg 


cctcagcctc 


ccaagtagct 


gggattatag 


gcatgcacca 


DO /uu 


ccacgcctgg 


ctaatttttg 


tatttttagt 


agagaegggg 


4> ^ ^ 4~ _ _^ 

ttttgccatg 


ttgaccagtc 


DO /OU 


tagtctcgaa 


ctcctgacct 


caggtgatcc 


acctgccttg 


gcctcccaaa 


gtgctgggat 


68820 


tacaggtatg 


agccaccaca 


cctgggctga 


aattactgtt 


tttataggtc 


aaaaacagtt 


68880 


gagggatagg 


catggtggct 


cccacctata 


atcccagcac 


tttcagaggc 


caaggcagga 


68940 


agattgcttg 


agtccaggag 


ttcga caeca 


gcctgggcaa 


tgtagtgaaa 


ccccatctat 


69000 


atttaaaaaa 


aaaaaataga 


tgaatatctt 


tgtttgcaga 


taacatgatt 


gcatatgtag 


69060 


aaaatcccaa 


agaaccaaca 


aaaagagctc 


ctagaactaa 


taagtgatta 


tgacaaggtg 


69120 


tagaatacaa 


agttaatata 


caaagtcaca 


ttgctttttt 


atctaccagc 


agtgaacaac 


69180 
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tggaatttga 


aattaaaaca 


caatactgct 


gggtgcagtg 


gctcacacct 


gtaatcccag 


69240 


cactttggga 


ggccgaggtg 


ggcagatcac 


ctgatgtcag 


gggttcaaga 


ccagcctgac 


69300 


caatatggtg 


aaaccccatc 


tctactaaaa 


atacaaaaat 


tagctgggca 


tggtggcggg 


69360 


tgcctgtaat 


ctcagctact 


caggaggctg 


aggcaggaga 


atcgcttgaa 


cccaggaggc 


69420 


agaggttgca 


gtgagccaag 


atcgcgccat 


tgcactccag 


cctgggggac 


agagcaagac 


69480 


tccgtctcaa 


aaaaaaaaac 


acaatacctt 


tcatattaac 


actaataaaa 


tgaaatatgt 


69540 


gtagttctaa 


caaagtttgt 


tgtagaagat 


ctatatgaga 


agaattatag 


cactcatgaa 


69600 


agaaatcaaa 


gatctaagta 


aactgagaga 


tattccatgt 


aaatggacag 


ggagactaaa 


69660 


tattattgag 


atgtcagttc 


ttcccaagtt 


catatatcga 


ttcagtgcag 


tcccagtcaa 


69720 


accccagcca 


gttattttgt 


ggatactggc 


aaactaaagt 


ttatatgaaa 


aggcaaaaga 


69780 


cctagaacag 


ccaacacagt 


attgaagaag 


aaaaaagtca 


gaggactgaa 


actacccaat 


69840 


ttcaagactt 


actgtaaagc 


tacattaatc 


aagacagcat 


gtcattggca 


aaagaataga 


69900 


caaataaatc 


agtagaattg 


gacagagagc 


ctagaaatca 


acccacacag 


ataaagtcaa 


69960 


ctgatctttg 


gcaaagggac 


aaagacaatt 


cagtggagaa 


aagatagcct 


tttcaacaaa 


70020 


tggtatagga 


caactggaca 


tccacatgca 


aaaaagttaa 


tctagacaca 


gacctgacaa 


70080 


ctttcacaaa 


aataaatgga 


tcatagacct 


aaatgtaaca 


tgcgaactga 


aacttctaga 


70140 


ggataacata 


ggagaaaatc 


taggataaca 


tgagaaaaat 


ttttggtttg 


gcagtgactt 


70200 


cttaggtaca 


ataccaaaac 


atgatccttg 


aaaaaaaaaa 


tcagtatgtt 


gaactttgtt 


70260 


taaattataa 


acttctgctc 


tgtgtaagat 


gctgttagga 


gaatgaaaag 


acatgcagca 


70320 


gagtgggaga 


ctttacaaaa 


ttcattatct 


gatgaaggac 


cagtatccaa 


aatatacaaa 


70380 


gaacttttaa 


aactcaacaa 


taagaaaata 


tacaacccag 


ttaataaatg 


ggcaaaatat 


70440 


ctgaacagac 


acctcaccaa 


ggaagataga 


tagatgacaa 


caagcatatg 


aatatatgct 


70500 


caacatcatg 


tcgttaggga 


aattgcgcat 


taaaacaaca 


acaagatacc 


ctgccatccc 


70560 


tattagaatg 


gctgaaatct 


aaaacactga 


caacaccaaa 


ttctggcagg 


gatgtggagc 


70620 


agcagaaact 


ttaattcatt 


gctgatggaa 


atctaaaatg 


gtagaaccat 


tttggaaggt 


70680 


agttggacag 


ttttttacag 


aactaaagac 


agtttgacag 


tttcttacaa 


aactcttacc 


70740 


atatggtcca 


gcagtcttac 


tccttagtat 


ttacccaaat 


aagtttaaaa 


tgtacatcca 


70800 


ataaaaaaaa 


ctgcacatga 


atatttctag 


cagcattatt 


catagttgcc 


aaaacttgga 


70860 


agcagtcaag 


gcatccataa 


gtaggggaat 


ggataaacag 


actttggtat 


atcatgtaat 


70920 


ggagtattat 


tcagcaataa 


aaagaaatga 


tctatcaagc 


cacaaaaata 


tatggaggaa 


70980 
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ccataaatgc 


atattgctaa 


atgaaagaag 


ccagtctgaa 


gaggctacac 


tataggattc 


71040 


tgactatatg 


atgttttgga 


aaaggcaaaa 


ctatggaaac 


agtaaataga 


tcagtggttg 


71100 


ccaagggaga 


cagggagaga 


tgaataggtg 


gagcacagtg 


gatttttaag 


gcagtgaaac 


71160 


tgttctttat 


gataatccaa 


tggtggatac 


atgtcattat 


acctttgtca 


aaacccacag 


71220 


aatataaaac 


ataagagtga 


accctaatgt 


aaaatatgga 


cttcagttaa 


taataatata 


71280 


tgaatatttt 


ttcattagtt 


ctaacaagtg 


tactacacta 


atacaagata 


ttcagagtag 


71340 


gggaaattgg 


aaaggaatga 


gaggttatat 


gggaactctg 


tactttctgc 


tcaattttct 


71400 


gtaaacctaa 


aatcactaaa 


aaaaaagttt 


atttttattt 


ttattttttt 


ttaattttta 


71460 


attttttgag 


atggagtttc 


actcttgttg 


cccaggctgg 


aatacaatgg 


cacgatctcg 


71520 


gctcactgaa 


acctccgcct 


ccagggttca 


agcgattctc 


atgcctcaac 


ctcccgagta 


71580 


gctgagatta 


caggcatgtg 


ccaccacgcc 


cagctaattt 


tgcagtttta 


gtagagacag 


71640 


ggtttctcca 


tgttggtcag 


gctggtcttg 


aactcctgat 


ctcaggggat 


ctgcccgcct 


71700 


cggcctccca 


aagtgctgtg 


attataggcg 


tgagcagctg 


cgcccagcag 


gttttttttt 


71760 


ttaagttgga 


tattagccat 


ttcatatgat 


tcaacttaaa 


agtacataca 


ccttcactgt 


71820 


tattaaagtg 


taggtgagat 


gttttcagtc 


tggagctcta 


cccttgattc 


ctgccatgcc 


71880 


tagtgtccct 


gaatctggag 


actctgactt 


atttctttag 


agaacgaaac 


tcctgccttc 


71940 


tgctttggtg 


gtgattggta 


cctgcttgac 


tgcctttggt 


ggggagttcc 


tcataccaac 


72000 


tttcaatcag 


ttcctgtgtt 


tgtttgtttg 


tttgtttttg 


agacggagtt 


ttgctctgtc 


72060 


gcccgggttg 


gagtgcagtg 


gcgcaatctt 


ggctcaatac 


acgctccgcc 


tcccgggttc 


72120 


acgccatttt 


cctgcctcag 


cctcctgagt 


agctgggacg 


acaggcaccc 


gccaccacgc 


72180 


ccggctaatt 


tttttgtatt 


tttagtagag 


acggggtttc 


atcgtgttag 


ccaggatggt 


72240 


ctcgatctcc 


tgacctcgtg 


atccgcccgc 


cttggcctcc 


caaagtgctg 


ggattacagg 


72300 


cgtgacgact 


gtaagccacc 


gtgcccggcc 


agttcctctg 


tttttgactg 


cctgccttac 


72360 


tactgctttc 


tgtggtgcct 


gataacatcc 


aattcctgaa 


ccttcctggg 


atttttgttc 


72420 


acgtcagcgt 


gcttcttgca 


tttaggtatc 


ccttcacaag 


taggcattta 


ggttttaagc 


72480 


tctgctaagt 


gatttaccac 


actttatcag 


ttctccattt 


tgtggaattc 


attgtgttaa 


72540 


tctccttttc 


tatttttgtt 


tggaagattc 


atatattttt 


tattcattta 


gtattttttg 


72600 


gtgggatttc 


taagtagaga 


aacatgccta 


tgttcaatat 


gtcttgttta 


agcagtctgc 


72660 


tttcattttt 


accaccgagg 


agttggtttt 


atttcttttt 


tttttttttt 


tttttttttt 


72720 


ttttgagaca 


gggtctcact 


ttgtcagcca 


ggctggagta 


cagtggcaca 


atcaaagctc 


72780 
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actgcaccct 


tggcctccca 


agctcaagtg 


atcctcccac 


ctcagcctcc 


tgaatagctg 


72840 


ggagctcagg 


tgatccagca 


cacccagcta 


attttttttt 


tttttaattt 


tttgtagaag 


72900 


cagagttccc 


ctatgttgcc 


caagctggtc 


ttgaactctt 


gggctcatgt 


aatcctcctg 


72960 


tctttgcccc 


ctaaagtctg 


ggattacagg 


tgtgagccac 


cacacccagc 


tgtttttaat 


73020 


tattacatta 


atttatgatt 


atgtgtttcc 


tttaaagcta 


tgggcagctc 


tgtttgggaa 


73080 


gatgctactg 


aaaaaaggat 


gctttttaga 


tggcaaagag 


tacttaaaat 


gtctctagaa 


73140 


tcatagttgt 


aaactaaagt 


atatattttt 


tagttgttca 


cagggcttag 


agctcctgcc 


73200 


agagggctgt 


tactctttgg 


tccacctggg 


aatgggaaga 


caatgctggt 


aagggttctc 


73260 


ttcaaatttg 


agttttctgt 


tgagatattt 


gggataatat 


gaaaaaaaga 


aactttatct 


73320 


tgtccttgag 


tctattattt 


acgacttgct 


ttttgctatt 


gtacactttt 


gttttttttg 


73380 


tttgtttgtt 


ttgttttgtt 


ttgagtgatc 


tgggctcacc 


gcaacctccg 


cctcctgggt 


73440 


tcaagcgatt 


ttcatgcctc 


agcctcccaa 


gtagctggga 


ttacaggcac 


acgccaccac 


73500 


acctgtctag 


gttttttatt 


tttggcagag 


acaggatttc 


gccatgttgg 


ccaggctggt 


73560 


gtcgaactcc 


tgacctcaag 


cagtcctcct 


acctgggcct 


cctaaagtga 


tgggattaca 


73620 


ggcatgagcc 


actgcacctg 


gctgatacac 


ttttaagttt 


ttcagctact 


tttcaatgta 


73680 


gaagtagatg 


gaaaaccatg 


tacgttatct 


tcagtagtgt 


gtttttggtt 


ggttaaattt 


73740 


gacagtatga 


ttgtcattat 


tttttgtaaa 


ttaaattttt 


acctggaaga 


gcttacctta 


73800 


ctatattgag 


tatctttcta 


acccctgatt 


tttgcttcta 


ctatcataat 


aactttattt 


73860 


aagtaatcag 


tatgttatag 


cttttttttt 


tttttaagta 


ttcttttgcc 


agaagttttt 


73920 


atcaggctct 


ggatacctct 


ttcctctgca 


tagtcctcct 


ggatggaaga 


aacaaagagg 


73980 


gaaagagtaa 


cttttcctta 


gatgtttgtc 


tttctcaaag 


cagttatctt 


tgtatatcta 


74040 


agaagagagg 


agaataacac 


tgtctctctt 


tttttttaaa 


tctctctcta 


ctcattctct 


74100 


ctcaggagga 


gagtagaaag 


aagcacagct 


cttcctataa 


cctgtcctta 


ttactgagaa 


74160 


aggaacacat 


tgattgccat 


gtattgggga 


ttgtattata 


ccttacattt 


ttatttttat 


74220 


tttttattaa 


tttttttttt 


tagacagtct 


tactctatca 


cccaagctgg 


agtgcagtga 


74280 


tgtgatctcg 


gctcactacc 


atctcttcct 


tctgggttca 


agcaattctg 


ccacgtcagc 


74340 


ttcctgagta 


gctgggatta 


caggcatgcg 


ccaccacgcc 


tgactaattt 


ttgtattttt 


74400 


attagagatg 


ggatttcacc 


atgttggcca 


ggctggtctc 


aaactcttgg 


cctcaagtga 


74460 


tgcgcctgcc 


tcggcctccg 


aaagtgctgg 


gattacaggc 


atgagccacc 


acacctggcc 


74520 


tcatagctta 


catttttaga 


gaatcttttc 


tagtacttaa 


atcggtaaat 


atggttatct 


74580 
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tttaaatgta 


atatattgaa 


ctaatttaat 


atttgetett 


gtgattttta 


aaggctaaag 


74640 


cagtagctgc 


agaatcgaat 


gcaaccttct 


ttaatataag 


tgctgcaagt 


ttaacttcaa 


74700 


aatacgtgag 


tgctctgttt 


ccaatattgt 


cgtattttaa 


gttactgtct 


aaatgttact 


74760 


gtgttaactg 


taaatggtaa 


tatttcatga 


aaatattttt 


ctaggagctt 


atctattgta 


74820 


tctattattt 


acatatgatg 


aatatctatc 


ttcagagtag 


aaagttatgt 


acatttgtgt 


74880 


tgtcaaatac 


tgtattagtt 


tactggggee 


atgtaataaa 


atacegtaaa 


ctggctggct 


74940 


taaacatcag 


caatttattg 


tctcacagtt 


gtggaaggta 


gaagtctaag 


atcagtcaaa 


75000 


atgttggcag 


ggttgcttcc 


tcctgagggc 


tgtgagggaa 


aatgtatgtt 


gtgtgcctct 


75060 


ctcctggctt 


ctggtggctt 


gctggcaatc 


ttttgtattc 


cttggcttgt 


agatgeatec 


75120 


ctcctatctc 


tgtctttatc 


tttatgtggc 


attctccctg 


tgtctgtcac 


catgtccaaa 


75180 


tttcccctgt 


ggattaggac 


ccaccctaat 


gatctcaatt 


taagtttgtc 


atcagcaaca 


75240 


attctatgtc 


caaataatgt 


cacattcata 


ggtactaggg 


ataggacttc 


aacacgtttt 


75300 


tggagaacac 


agttcaaccc 


attaacaaat 


actatcactt 


tccacttaag 


cttcaagtaa 


75360 


agtggatttt 


atctcaagga 


gccaccagat 


aggaacacag 


atctgatggc 


ataaactgag 


75420 


tatttctggc 


cttctgattc 


tgatctaaaa 


tatgacagaa 


gattttccct 


gttttaattt 


75480 


tttttttttt 


tttataatag 


agacacagtc 


tcgctatgtt 


gccaggctac 


tttcaaattc 


75540 


ctgggcttaa 


gcaatcctcc 


tgcctcggac 


tctcaaagtg 


ctggaattac 


aagtgtgagc 


75600 


caeca cacct 


ggecagtaga 


ttttccctgc 


tttcttttga 


ttgtttataa 


ttttgttttc 


75660 


tttttccatt 


caccctctgc 


tgaccctata 


gtattattca 


aagaagtgtt 


cagtctagtt 


75720 


ttggggtagg 


gcaagcataa 


etacagtget 


taaagagagt 


aatttgtctg 


gtgtgcagaa 


75780 


ctagtgtgta 


aatataactg 


gtgeattgea 


aaactgtgaa 


gtagtttctg 


tcaaacctta 


75840 


cactgetttg 


tctttctccc 


tctctccctt 


tctcttggtt 


gccccctccc 


cctcccaatg 


75900 


ataccttagt 


ctctgcttgc 


ctttatcaaa 


acctttatga 


ttggccgggc 


acagtggccc 


75960 


atgcctataa 


tcctagcatt 


ttgggaggct 


gaggcaggaa 


gatcacctga 


geccagaagt 


76020 


tggagaccag 


cctaggcaac 


atggtgaaac 


cccatctctt 


ccaaaaataa 


aaaatagagc 


76080 


caggtgtggt 


ggcatgcacc 


tgtagtccca 


gctactcagg 


aagctgaggc 


gagaggatct 


76140 


ettgagectg 


agaggttgag 


gctgcagtga 


actgtgatca 


tgccactgca 


ctccagcctg 


76200 


agtgacagtg 


tgagaccctg 


tctcaaagaa 


acaaaacaag 


ggggggcatg 


gtggctaact 


76260 


cctgtaatcc 


cagtactttg 


ggagactgag 


gcaggaggat 


tgettgagge 


caggagttca 


76320 


ataccaccct 


gggcaacata 


gtgagacccc 


catctctaca 


aaaaataaaa 


aatttagctg 


76380 



88 



gacatgccag 


cgaatacgtg 


gtcccagcaa 


atcaggaggc 


tgaggtggga 


ggatcacttg 


76440 


agtcaaggag 


gttgaggttg 


cagtgagcca 


cgatcatgcc 


aatgcattcc 


aacctgggcg 


76500 


tcagagcaag 


accacgtctc 


aaaaacaaaa 


caaaacaaac 


ttttatggtt 


gaaagtgttt 


76560 


tggcaaacat 


acttaaactg 


aaatgtgaat 


ctctgatgaa 


agaacatgtt 


acctgtaaaa 


76620 


gtttgaagtg 


tcagcatttg 


ttgcaccgaa 


atccagaggt 


gaggccaggt 


gtggtggctc 


76680 


acgcctgtaa 


tcccagcact 


ttgggaagcc 


aaggctggca 


gatcacctga 


ggtcaggagt 


76740 


tcaaaaccag 


cctggccaac 


attgcaaaac 


cccgtctcga 


ctaaaaatac 


aaaaattagc 


76800 


cagacttggt 


ggtgtgcgcc 


tgtaatccca 


gctattcggg 


aggctgagac 


acgagaattg 


76860 


ctcgaaccca 


ggaggcagag 


gttgcagtga 


gccgagatgg 


caccactgca 


ctccagcctg 


76920 


ggcaactgag 


tgagactctg 


tctcaaaaaa 


aaaaaaaaaa 


aaaaatccag 


aggtgaatcc 


76980 


agaggtgatc 


accacatgat 


atccagatag 


cctctttcca 


tgagaggctc 


aaaggataat 


77040 


tttactgtct 


acagttttgc 


agcgagagaa 


acttgatttt 


atcagtacac 


caagagcaga 


77100 


tctatgtctt 


cggaacagac 


atgagatcag 


aattgtctag 


ctgctatgaa 


cagcatgttc 


77160 


tctccctgta 


cctatagaca 


tgtatgggaa 


acttatttgt 


aaggttgtat 


aatgagcagt 


77220 


gagttaaagc 


aaacttgaca 


tgttgaccat 


agttgttatg 


gcattggact 


aaagtagcct 


77280 


ccatcactat 


gatagagata 


gccttggtgt 


tggacccata 


gtttttgaag 


tctgtttgct 


77340 


aagactccct 


cttccttagg 


cagttcttca 


aatattatta 


tgctttttcc 


tgtcatggga 


77400 


ttcctcttca 


tggagtttcc 


tttctcagga 


acactatctt 


ctcctggtta 


atttgtactt 


77460 


attcttcaga 


taccagttga 


aatgttacaa 


ccttccctga 


ccctccaaac 


tattccccgt 


77520 


tattattctc 


ctagcaccac 


ttgcacctca 


ttttcatact 


cactggagtt 


gcaattcata 


77580 


ttcattgata 


ggattatttt 


aattgtatct 


gatatcactg 


tcacctccac 


tagaagatgg 


77640 


tctccatgcg 


ggcagagact 


atcaccatgt 


gttcttcact 


tcaattttca 


gtagttggct 


77700 


gtgagtaggt 


attgaataaa 


tatttgtgga 


gtaatcataa 


tgaggtatag 


atattattct 


77760 


catagctcta 


ttttattaat 


tagggaatta 


cagaattcag 


tgatctgctc 


aggatctcat 


77820 


aaccaggaag 


tgggaaacta 


ggatttgagc 


tccagtgagt 


gtggcctttc 


attaaaaata 


77880 


l» V— U V— CI H 


cattctcttt 


tttttttttt 


ttttttttga 


oataaaatct 


tgctctggag 


77940 


tgcagtggcg 


tgatctcggc 


tcactgcagc 


ctctgcctcc 


cgggttcaag 


tgatccccct 


78000 


gccttagcct 


gctgagtagc 


tgggactaca 


ggcacccgcc 


acgacacttg 


gctaattttt 


78060 


gtattttagt 


agagacgggg 


tttcaccatg 


ttggccagga 


tggtctcgat 


ctcctgacct 


78120 


tgtgatccgc 


ccgcatctac 


ctcccaaagt 


gctggattat 


aggcgtaagc 


caeca caccc 


78180 
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ggcctacagc 


aaccattctc 


ttttatccat 


act t tut tea 


s n s /T 4~ a 4- 4— 

agagLactgu 


1 1 Cd LCLtCd 




tgttttcaga 


aacaacatag 


j» a ^» a ^™ Mtf a 4— 

cattcacgat 


4 s * 4" +• ^ ^ j>"^ /■* 

CtCadCCCCC 


a a. 1 1 C ty cl Id 


ty ty aa l< 


78300 


atcttgaagt 


aagtttactt 


ttaagaaagt 


tgaggctagg 


+* /t4- 4— n n 4— 

tgtggtggct 


C.a ty CCtg ta 


70^ fin 


atcccagcac 


tttgggaggc 


caaggcaggt 


ggatcacttg 


agctcaggag 


ttcaagacca 


*7 0,1 on 


ggctgggcaa 


catggcgaaa 


ccctgtctct 


accagaaata 


caaaaaatta 


gtcgggcgtg 


/ Ol 0 U 


gtggcgtgtg 


cctgtggtcc 


cagccacttg 


ggagactgaa 


gtgggaggat 


ttcttgagct 




tgggaggtgg 


agtttgctgt 


gagccgagag 


atcatgccac 


tgtactccag 


cctgggtggc 


/ ODUU 


agagtgagat 


cccatctcaa 


aaaaagaaaa 


gaaaaagaaa 


a ttgaaatgt 


ctagtctat c 


/ DDDU 


attttgtcag 


ttctatctaa 


tacaattttt 


tccttatgtc 


taactgaaat 


^4-/^^4-4-4-4-4-/^ 

ctgett tttc 


nan 0 n 


taatttttac 


atacttgatt 


taacaaaact 


caatcttttt 


4-4-4-*-4-+-+-4--!»4- 

ttttttttat 


gagacagect 


n fin ft n 


ttcaaatata 


taggaactta 


atgttatatc 


tgcttccctc 


cagtccccag 


aa tag t tact 


n fift/4 n 


attttagttg 


tctttctatg 


gtctcatgcc 


agtttgtcag 


tatgectaga 


taagaactga 


/D?UU 


atattttacc 


tcagatgtga 


cctgactttg 


aagacttaaa 


aaggaagcat 


tgtgccaggc 




gcagtggctc 


acacctgtga 


tcccagcact 


ttg gg agg cc 




y y tt-oy y ciy u 


79020 


ttgagaccag 


cctgattaac 


atggagaaac 


cccatgtttc 


4V* ^^4» A M 4— M A A 4>* 

tctactaaat 


acaaa tctct 


7 Qnftn 

/ 3UOU 


actaaatact 


aaatactaaa 


tctctactaa 


aaatacaaaa 


gatgagctgg 


gca ttgtggc 


7 Qi d n 


acatgcctgt 


aatcccagct 


actcgggagg 


ctgaggcagg 


agaatcactt 


gdgCCCaggd 




ggcggaggtt 


gcggtgagcc 


gagattgcgc 


cattccactc 


cagcctgggc 


aacaaaagtg 




aaactccatc 


tcaaaaaaaa 


aaagcagcag 


cattgtgtaa 


tatta tgtag 


4— 4- 4- 4- /-r 4- « 

a tg tty ty t C 




tcatgatcta 


tcctgagaaa 


gcttttggga 


ggaactgeat 


ca tag teat g 


a y— i —3 /— ■ 4— 4— 4- 

^aCadCaLu U 




gtgttattaa 


aatatctaga 


ttattttcca 


caaaaaatca 


gttacatatg 


•4— — ^ 4— #— ^ 4— 4" « — , 


/ J H *i tJ 


tgttgtatta 


ttgtttaacc 


ttgtttattg 


aataactaac 


s ^* +* 4 A 3 S 

aug^&gaacLcL 


y tel 1 1 L. L>ciy 


79500 


cataagtata 


cagctgtata 


cagctcag tg 


gattaccaca 


aagegaatat 


aCCCCCd tela 


79560 


tcaccaccca 


ggtcaagaaa 


taaattgtta 


cctgtggccc 


taaaatccct 


ccatj g tci 1 1 1 


7 9620 

/ -7 Ufa V 


caccatcttt 


atccactcac 


tcctctccct 


caaaaccact 


agactactaa 


A— >— ■ a 4— 4 y^ ■ — > /— • 

catcatagac 




aaagctagca 


tgcctttgaa 


ctttatataa 


atctaatgat 


gtaggatttt 


gtgtgtatgt 


79740 


gtatttggct 


tctttcatca 


gcattgtatt 


tgtgagattt 


atccagattg 


ttgeaagtag 


79800 


ttgtagttgt 


gcttttttac 


acagatttaa 


tttttatatt 


tttcttatat 


gttcgaacag 


79860 


ttaacctgct 


tatctattat 


taaaaaaaaa 


aaaacgaaca 


ttcacatagt 


tcttaccagt 


79920 


ttacagtgtt 


ttttccacac 


cgtcttcaaa 


atgtaaagtt 


tggtcttcaa 


tacatcagta 


79980 
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tgctgctaga 


tttaaatact 


agggaaaaaa 


aaatcagaga 


agttaataat 


attaactgtc 


80040 


acctccacta 


gaagatggtc 


tccatgtgga 


cagtaatatt 


tctcttgtat 


tatctgtgct 


80100 


aagtaaaatc 


ttctgtaagt 


ttctttaaat 


attttaataa 


atcatagtac 


ttaaaatgtt 


80160 


ctcaatattc 


taaagtagtt 


aaaagtaact 


ataaaatagt 


acctgttttt 


ctgatcacat 


80220 


tttacttcct 


atgtgaaatt 


ttacaagtcg 


ttactctatt 


tatttattga 


tttatttttt 


80280 


aagacagggt 


ctgttctgtc 


gcccaggctg 


gagtacagtg 


gcgtgatcat 


ggctcactgc 


80340 


agcctcagcc 


tcctgggctc 


aagtgatcct 


cccaccttag 


catcccaagt 


agctgggact 


80400 


ataggcacat 


gccaccatgc 


ccagctaatt 


ttaaaaaatt 


ctggggggcc 


gaatgcggtg 


80460 


gctcacacct 


gtaatcccag 


cactttggga 


ggccgaggca 


ggcgaatcac 


aaggtcagga 


80520 


gttcgagacc 


agcctggcta 


acatggtgaa 


accctgtctc 


tactaaaaat 


acaaaaaatt 


80580 


agcggggtgt 


ggtggcaggc 


gcctgtaatc 


ccacttactc 


aggaggctga 


ggcaggagag 


80640 


ttgcttgaac 


ctgggaggca 


gagattgcag 


tgagccgaga 


ctccatctca 


aaaaaaaaaa 


80700 


attttttttt 


gtagtgacaa 


ggtgtcactg 


tgttgccagg 


gctggtctca 


aacttctggg 


80760 


ctcaagtgat 


cctcccattt 


cggcctccca 


aagtgctagg 


atcacaggca 


tgagtcactg 


80820 


tgcctggtct 


tcaagttgtt 


attaaagcat 


gtttacccac 


attatgcaca 


tggtataatg 


80880 


gaaagtattg 


ttgtggaagt 


taggagatag 


ggattctagc 


ctagcttttt 


atttttttgg 


80940 


gacaaggtct 


cactttttcg 


ccccaggccg 


aagtgcagtt 


gtgcgatctc 


ggctcactgc 


81000 


aacctccaac 


tctcaggttc 


aagcaattct 


cccacgtcag 


cctcccgagt 


agctgggatt 


81060 


acaggcatgc 


gccaccacgc 


ccggctaatt 


tttgtagttt 


tagtagacac 


agggtttcac 


81120 


catgttggcc 


aggctggtct 


tgaactcccg 


acctcaggtg 


atccacccac 


cttggcctcc 


81180 


caaagtgctg 


ggattacagg 


catgagccac 


cgcacccggc 


ctctagcgta 


acttttacat 


81240 


cctgaactga 


ccttaagaaa 


gtataacttt 


aggcctgttt 


catctgtaaa 


atgttaatgt 


81300 


cataggagat 


gatcttttga 


gatttctttc 


agctctgata 


attttgtgtg 


tgtgtgtgtg 


81360 


tgtgtgtgtg 


tgtgagatgg 


agtcttgctc 


tgtcgcccgg 


gctggagtgc 


agtggtacca 


81420 


tctcggctca 


ctgcaagctc 


cacctcctgg 


gttcacgcca 


ttctcctgcc 


tcagcctccc 


81480 


gagtagctgg 


gactacaggc 


gcctgccacc 


acgcctggct 


aattttttgt 


atttttagta 


81540 


gagacgaggt 


ttcaccgtgt 


tagccaggat 


ggtctcgatc 


tcctgacctc 


gtgatccgcc 


816O0 


cgcctcagcc 


tcccaaagtg 


ctgggattac 


aggtctgagc 


cgccgcgccc 


ggcctagaat 


81660 


atttgtttcg 


attattctaa 


atctggtgac 


atttcttttg 


tttttaagtt 


aaatcttcag 


81720 


taaaaagaat 


aaatgccacc 


tagaggacag 


aaaaattttt 


acagtagatt 


atcacagacc 


81780 
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tcatgactca 


ttactttggt 


gtataaaatg 


gcctttgtat 


ggtgtcagca 


cctgggaatg 


81840 


tctcaagggg 


tgttcattga 


ccttctggac 


tatctggaaa 


tattttgata 


tttattggct 


o i ft n ft 

o lyuu 


gggcgcggtg 


gctcatgcct 


gtaattccag 


cacctcggga 


ggccaagtta 


ggtggatcac 


81960 


ttgaggtcag 


gagtttgaga 


tcagcctggc 


caactaagtt 


agttgactat 


ttgtgaaatt 


82 U2 U 


tccctctcca 


aataggaaag 


ataggattgg 


aaacattatt 


cagaaggaag 


aagttttaaa 


a o i~i r> 

82080 


gaagggcagg 


cttaaagact 


atctaatgaa 


tttaccaata 


tggtaaaacc 


ccatctttac 


82140 


taaaaataca 


aaaattagcc 


aggcgtggtg 


gtgggcgcct 


gtaatcccag 


ctacctggga 


82200 


tgttgaggga 


tgagaatcac 


ttgaacccag 


gaggcaaaag 


tcacagtgag 


ccgagattgc 


B226U 


accactgcac 


tccagactgg 


gctatagagc 


aaaactctgt 


ctcaaaaaaa 


aaaaggaaaa 




aaaaaaaaga 


aattttgata 


tttatgtgag 


aatgactttt 


cacggtgttc 


ttaatagcgc 


O ft O O ft 

82380 


aagttttgtt 


taggagagca 


cattccaact 


tacttgcttc 


tataaatata 


ccgtgtaatc 


ft ft il Jl ft 

82440 


tagggcttaa 


agaatatgta 


caatgtcttt 


ttctctcccc 


tagtcttccc 


cttttctcac 


ft ft e ft ft 

82500 


tagttatatc 


cttgactgaa 


gagctatttc 


attctcaagt 


cttaggaatg 


cagggtgaag 


82560 


caaaacagat 


gaatttttaa 


agcacttaac 


caggctgtat 


gaaatcacag 


tctgttgtct 


O 1 ^ft ft 

82620 


aaaattgtaa 


gggacggtta 


gtagtactct 


cccctttctc 


aaaccaaatc 


tttggttgtt 


ts/oo u 


ttaaggaagg 


gaaattaaat 


tcctgtgtgc 


tagattttca 


acataaaatt 


taaaaaactg 


OZ / 4 U 


gaataatgtt 


gcattttatg 


tgtataacag 


tataatgctt 


tgttttaggt 


gggagaagga 


DZDUU 


gagaaattgg 


tgagggctct 


ttttgctgtg 


gctcgagaac 


ttcaaccttc 


X- — __ _ __ X* __ ^ A— X. 

tataattttt 


OzooU 


ataggtaaga 


acatattttc 


caactaagtt 


attgactatt 


tgtgaaattt 


ccctctccaa 


o292U 


ataggaaaga 


tacgattgga 


aacattattc 


agaaggaaga 


agttttaaag 


aagggcaagc 


ft ft ft O ft 

82980 


ttaaagacta 


tctaatgaat 


ttagtaggac 


ccactatatt 


aataagtagt 


aaactagatt 


q on/I n 


aatctcagat 


gactcacata 


gcttggtctt 


taattaaagt 


cttatacttg 


X. __ X* X» X- __x. ^_ x» 

tatttcctct 


on on 


agatgaagtt 


gatagccttt 


tgtgtgaaag 


aagagaaggg 


gagcacgatg 


ctagtagacg 




cctaaaaact 


gaatttctaa 


tagaatttga 


tggtgtaagt 


gttgattatg 


atatttttaa 




tgtggcagca 


ttttagtata 


ttttcctatt 


aaatggccaa 


ggttaaaaat 


acaaatatct 


O O O Q A 


ttatatttgt 


tattactttt 


ctaaatgaat 


tgaaaaaaga 


ttttttgctt 


gtaggtacag 


83340 


tctgctggag 


atgacagagt 


acttgtaatg 


ggtgcaacta 


ataggccaca 


agagcttgat 


83400 


gaggctgttc 


tcaggtaggg 


agatttatat 


ggaaatacat 


gcatttatta 


cagacaatat 


83460 


ttactcatgt 


gtccatctta 


catattattt 


ccttactctc 


agttttaaga 


ctaaattcac 


83520 


tattttcttc 


cagtactatc 


tctagcctct 


tgttaccaac 


tacataagga 


ttttgaggtc 


83580 
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aacagcttga 


tatcaggaga 


attagtctag 


taaaggttta 


gttacggttt 


taggcaaatt 


83640 


ggtcagttct 


tctgggttgc 


attaaattat 


ctttaaactt 


gaaaattgat 


tcttaccgtc 


83700 


ttttattggg 


cttcatgaga 


aaataatcaa 


atcagggttc 


atggaaaatg 


tgttttctgt 


83760 


tcttgtgtgt 


ttgagcagtt 


tattcccttc 


atactggaag 


gacggtttgg 


gtcagcataa 


83820 


aattcttggg 


catcctttcc 


caaggaattt 


acaatattgc 


tccattgttt 


ctagattggc 


83880 


tgtagtagtg 


taaaagtctg 


aatccaaatt 


gattttttca 


aatttgtaaa 


ataactftgat 


83940 


ttttttctct 


ctttactgga 


tgggttacgt 


gggtatattg 


cacccaggta 


gtgagcatag 


84000 


ggtgcagtag 


gtagtttttc 


aacccacacc 


tcactgcttt 


cttcccccat 


gtagtagtcc 


84060 


gcagtgtgta 


ttgttcccat 


gtttatgtcc 


atgtgtactc 


aatttttagc 


tccccactta 


84120 


tgagaacatg 


agctatttgg 


tttactgttc 


ccacattaat 


tggcgtagta 


ttaaggcctc 


84180 


cacctccatc 


catgttgctg 


caaaggacat 


tatttcattc 


ttttttatgg 


ctgcgtagta 


84240 


catagtattc 


catggtgtgt 


acgtaccaca 


ttttctttat 


ccagtccacc 


attgatggac 


84300 


acttagattg 


attctatgtc 


tgctgtcatg 


aatagtacag 


caataaacat 


gaaatgcatg 


84360 


tctttttggt 


ataatgatct 


attttccttt 


gggtatatac 


ccagtaatgg 


gatttcaggg 


84420 


tcaaaggtag 


atttgtttta 


tgttttttga 


gaaatcttca 


aactgctttc 


tacaatgact 


84480 


gaactttaca 


ttcctaccag 


cagtacatac 


gctccacaac 


ctcaccaaca 


tctgttattt 


84540 


ttttactttt 


tcccgccaat 


ctgtagacaa 


tatgggattt 


tttttgccat 


tttattaata 


84600 


gccattctga 


ctggtgtgag 


atatctcatt 


gtgattttga 


tttgcatttt 


tctgatggtt 


84660 


agtgatgatg 


agcatttttt 


catgtttgtt 


gtcccctcgt 


atgtcttttg 


agaagtgtct 


84720 


attcatttcc 


tttttaccca 


ttttttaata 


gggttgtgtg 


tttttagctt 


gttcaattgt 


84780 


ttgaattcct 


tatagattct 


ggatatcaga 


ccattgttag 


atgcagttct 


gtagattgtc 


84840 


tgtttactct 


gttgatggtt 


ctttttgctg 


tgcagaagct 


ctttagttta 


attaggtccc 


84900 


acttgtcaat 


ttttattttt 


gttgcaattg 


tgtttgggga 


cttagccaaa 


atttctttct 


84960 


gaggctgatg 


tcaagaagtg 


tatttcctag 


ttttcttcta 


gcatttttat 


actttgagat 


85020 


cttacattta 


aatctttaat 


ccaccttgag 


ttaatttttg 


tatatggtga 


aaagtaaggg 


85080 


tccagtttca 


tttttctaca 


tatggctagc 


cagtaatccc 


catgccattt 


attgaatagg 


85140 


gagtcctttt 


cctcattgct 


tgtttttgtc 


agtcttatca 


aagatcagat 


ggttataggt 


85200 


gtgtggcttt 


atttctcaat 


tttctgtcct 


gttcctttgg 


tttgtgtgtc 


tgtttttata 


85260 


ccagaattat 


gctgtttggg 


ctgctgtgta 


gttcggttta 


aagtcaggta 


acgtgatact 


85320 


tacagctttg 


ttctttttgc 


ttaggattgc 


tttgtctatt 


tggactcttt 


ttttgcttcc 


85380 
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atatgaattt 

aaataccatt 

caggcaagag 

cttcactggc 

agaactgata 

gtaccatttc 

tttacaatag 

cccagcactt 

ctgaccaaca 

ggtgggcgcc 

ggaggcatag 

agcaagaatc 

cctaggaata 

tgctaaaata 

gaagaatcaa 

ctgttttctt 

aattttcttc 

cctgttgcct 

aactcttctt 

ttcatcttct 

cactgggctc 

gagtttgaga 

ttagctgggt 

tgaacccagg 

ggacagagca 

gtgggtcaca 

cagaccagcc 

aaaattaaat 

tttagtttgc 

ttattgtgtt 



tagaatattt 

gaatctgtaa 

aaggaaacaa 

aatatgattc 

aatgatttta 

tatacgctaa 

ccacaaagaa 

tgggaggctg 

tggtgaaacc 

tgtaatccca 

gttgcagtga 

cgtttccaaa 

cggctgatga 

aatcagaggt 

tatcgttaaa 

ttgcacataa 

ttcatccttt 

ttatttctta 

tccttggtgg 

gttttatttc 

ttgtttcata 

ccagcctggc 

gtggtcacac 

aggcagaggt 

aggctctgtc 

cctgtaatcc 

tcgccaacgt 

ttttaaaaaa 

tctatggcaa 

ttgtttgctc 



ttttctaatt 

attgctttgg 

aaggcatcca 

tatactttga 

ccccaagatt 

taatgtccag 

aatgaaataa 

aggcaggtgg 

ccgtctctac 

tctgctcggg 

gccgagatcg 

attaaaaaaa 

aggaggtgaa 

gacacaaata 

atgggaaatt 

attatgtgtt 

taaactctta 

ctgggttagt 

ttttttattc 

tttgagcatc 

gaaaacaatt 

caacatagta 

acacctgtaa 

tgcagtgagc 

tcaaaaaaaa 

cagcactttg 

ggcaaaaccc 

ttaaattatt 

aatcttctca 

ttttttgggg 



ttgtgaaaaa 

gcagtatagt 

aataggaaaa 

aaaccctaaa 

caggatacaa 

gctaagagtc 

tggctgggca 

atcacctgag 

taaaaataca 

aggctgaggc 

tgccactgca 

aaaaaagaaa 

agaatctgta 

aatggaaaaa 

tatcttaatt 

atgttgcgtc 

ggtctttttg 

atctaatctc 

attactttcc 

tgtatgttat 

ttttggcaag 

caaccctgtc 

tcccagctac 

caagacggcg 

aaagaaaaaa 

ggaggccaga 

catatctata 

ttatttcgtg 

tgcatgttct 

gcaggttttg 



caacattgat 

cattttacga 

gaagtcatca 

aattccgtca 

aatcagtgta 

aaatcaagaa 

cagtggctca 

gtcaggagtt 

aaaaattagc 

aggagaattg 

ctgcagcctg 

aaaaaaaaga 

tgaggagaag 

cactccatgc 

tttttcccta 

cttttgtttt 

ttttgttctg 

ctttctgcta 

tgacatctgt 

ttccataagc 

gacagaccac 

tctgctaaaa 

tcaggaggct 

gcactgtact 

ttttttggtc 

tcacttgagg 

aaaaaaactt 

gaaagatact 

tcattttatc 

ttgttgttgt 



agtttgatag 

ccagataaat 

tactctcact 

aaaggctact 

caaaaaatta 

cacagtccca 

tgcctgtaat 

cgagaccagc 

caggcgtggt 

cttgaaccca 

ggtgtgaaag 

caatggagta 

tgtaaagcac 

tcatggattg 

gttcattttt 

ccctatctgt 

ttttcccaag 

tatcttttgt 

tattctactt 

tcttacattt 

ttgaggccag 

atacaaaaaa 

gataatcgct 

ctagcctggg 

aggcgtcatg 

ccgggaattc 

aaggataaaa 

tggtcataat 

tagtttatgt 

tttttttttt 



85440 

85500 

85560 

85620 

85680 

85740 

85800 

85860 

85920 

85980 

86040 

86100 

86160 

86220 

86280 

86340 

86400 

86460 

86520 

86580 

86640 

86700 

86760 

86820 

86880 

86940 

87000 

87060 

87120 

87180 
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ttttttttaa 


atgagccctg 


tcctggtttt 


tccttttttg 


cttattattt 


ttctttgaat 


87240 


aaaaggagtt 


ttcttggaaa 


acctagtttt 


ggaaggatat 


tgtaggggaa 


gggataggta 


87300 


tcttgagtag 


tccatgtata 


cactaaacta 


gcatgcagcc 


tccctcactt 


acagtgaagc 


87360 


cctacctaat 


aatgaagtat 


atgtgtatgt 


aaataagaga 


tagggttgat 


ttattcttct 


87420 


actaaaaaat 


attggtcact 


gcaagacatt 


gtcttcccgc 


cagactgtta 


gatgccttct 


87480 


tataaagata 


attcgtctta 


gagtttcttt 


gttcattctc 


accttccttg 


ccattcctat 


87540 


gctatcaatt 


agggtttata 


tggtctgcag 


agccaggctt 


catatgcttg 


tttaaatgtg 


87600 


gagggactgg 


ccttattacc 


ctttagggtg 


tgctatctct 


ttttgggagg 


aaaactgtac 


87660 


tctgacagtc 


atgtccatga 


tctttagcgg 


cagatccttt 


gtgtgtcttc 


ctttgtcagt 


87720 


gtaattttca 


ctgccctagg 


cagttcacct 


ttatgtattt 


tagttccata 


aatgttacct 


87780 


agtttgttga 


tgaagtgtat 


gtttctgttt 


ctattatcct 


tgctgatttt 


agtttttttc 


87840 


agattcaaga 


agacagatct 


acttatatca 


gatattttgt 


ttgttttaaa 


gcattactgc 


87900 


tattaaaaac 


atatacatac 


ataaatgatt 


aattctaaca 


ataccgaatt 


aaggatttta 


87960 


aacattaact 


agagttttaa 


aagagtaaca 


aaaatatttt 


tacattgata 


actaccaaaa 


88020 


tgcattccag 


tgccttgaat 


attatatttt 


aaaagctttt 


cctgtcattt 


gctgtttcag 


88080 


ctttaaattc 


aaaattatat 


ttctaaaagt 


gctggatttt 


tttttttagg 


cgtttcatca 


88140 


aacgggtata 


tgtgtcttta 


ccaaatgagg 


aggtatgtat 


ctgtgtttga 


attttttttg 


88200 


ttttagagca 


gaaacaagaa 


ctaccatctt 


gacaatatta 


agtcttccaa 


tccatggtac 


88260 


agctactttg 


gaaaacagtt 


tagtggtttc 


ttaaaaagat 


gtacataagc 


ttactgtcag 


88320 


agccagcaat 


ttcactccta 


agaatttacc 


ccagagaaac 


aaaaatgtat 


gtccacacaa 


88380 


agacttgtac 


aagaattttt 


atagcagcaa 


tattaataat 


agccagaact 


acaaatgatc 


88440 


taaaatgttt 


attttggtga 


ataaacaaat 


gtggtatatt 


catttaatgg 


atactgttat 


88500 


ccattataca 


tgctgcatac 


tcacttcata 


tattaagttt 


tatgaatgaa 


actccaaaac 


88560 


attataagtg 


aaagaagcaa 


gatgatatat 


gtcgcatatc 


ataggattct 


gtttatatgc 


88620 


agaaaacgca 


aatttatttt 


ttatttattt 


atttttttga 


gatggagtct 


tgctctgtcg 


88680 


ctcaggctgg 


agtgcagtgg 


cgtgatctcg 


gctcactgca 


accttcacct 


cctgggttca 


88740 


agtgattctc 


ctgcctcagc 


ctcctgagta 


gctgggactg 


caggcatgtg 


ccaccaggcc 


88800 


tggctaattt 


tttgtgtttt 


tagtagagac 


gggtttcact 


gtgttagcca 


ggatggtgtg 


88860 


atccgccctc 


ctcagcctcc 


caaagtgctg 


ggattacagg 


catgagtcac 


cgtgcccggc 


88920 


cagaaatcga 


aaatttctag 


aaacgtaaag 


cagatcagtg 


ggttgtcagg 


gtgagagttg 


88980 



ggaatgagga 


ttaactgcaa 


acaggtatga 


gtgaactaaa 


aagtgttcta 


aaactggatt 


89040 


gtggtgatga 


ttgcacatct 


ataaatgtat 


taaaactcat 


tgaattatat 


acttacaatg 


89100 


ggtgaaattc 


atagtagatg 


aattcatacc 


tctataaaac 


tggttttttg 


cagcaaaata 


89160 


tttattgcta 


tgtttttatt 


caagtgtggt 


gaattattgc 


tatgttttta 


tccaggtgtg 


89220 


gtgtctcacg 


cctataatcc 


caacactttg 


ggaggctgag 


gtgggaggat 


cgcttgagcc 


89280 


aggaattcaa 


gaccagcctg 


ggcaacatag 


ggagaccctg 


tctctacaaa 


aacttt!ttta 


89340 


gaaattaacc 


aggcatggtg 


gcacgtgcct 


ttggtcccag 


ttactcggga 


ggctgagatg 


89400 


ggaggattgc 


ttgaacccag 


gatatcgagg 


ctatagtgag 


ctatgattgt 


gccctgcact 


89460 


ccagcctggg 


taacagcaca 


agaccctgtc 


tcaatataaa 


aaaagaaaag 


aatcattaat 


89520 


tctgaaatta 


gactgaatga 


tcatttttta 


atatttttca 


gacaagacta 


cttttgctta 


89580 


aaaatctgtt 


atgtaaacaa 


ggaagtccat 


tgacccaaaa 


agaactagca 


caacttgcta 


89640 


ggtgagtaat 


ttggatttgg 


tttatcttac 


agcttttatt 


tattttttgt 


aaataattct 


89700 


ttttttagtt 


atttaaagta 


atcttaagta 


tgaaatgagt 


aattcattga 


tcagaagact 


89760 


ttctctcatc 


ctctacctcc 


tttgcctttt 


tcttacctct 


tgttcttata 


tatatatgtg 


89820 


gaatctaaat 


ttcactggct 


atgtcctttg 


caagacgtga 


tctaatgatg 


atagtatatt 


89880 


ctttttataa 


atttattaaa 


acctgtaagt 


ggtattaaag 


taatttaaac 


atttacacct 


89940 


taggcaacat 


ggtaaaaccc 


catctctaca 


aaaaataaaa 


tgagtcagga 


atggtggcac 


90000 


atacctgtag 


tcccagctac 


ttgggaggtt 


gatgtgggag 


gatcgcttca 


gcccgggagg 


90060 


tggaggttga 


gcaacagagt 


gagaccctgt 


ctcaaaaaaa 


attttaaaca 


tttcatattg 


90120 


cacactaaca 


cagatatttt 


tatataaact 


tgttcttggc 


atatgctgaa 


tacttttcag 


90180 


ctcttttaat 


aattttaatt 


atttgataat 


tttaataatt 


ttaatttcag 


ctatttgaat 


90240 


aatcttaaac 


tttatgaaca 


gtgtgaagta 


gaaactgagt 


ataggagatg 


cgctcatgaa 


90300 


ttttattccc 


tgaaaaatgt 


cataaagtaa 


tataaagtat 


tcaatgagta 


tgtgagtatt 


90360 


gaataatttt 


aacaagaact 


ctgagttccc 


agatacctat 


gacaaaagaa 


caaattactt 


90420 


ggaagtctct 


tctactccag 


acctttctgt 


ctatcccctt 


atttaaaaaa 


atgtacattg 


90480 


attgtccctt 


atcccatcaa 


gagagtgttc 


tttgccaaga 


taaacgctaa 


ttagagaagt 


90540 


aattgtgttt 


atgtgtcagt 


tggccaccag 


tagtttgtag 


atgttacctt 


tccaggtgac 


90600 


atgtttacaa 


tttaatgaag 


cctctggaga 


tagtatgcct 


taatctaaag 


gaatggttct 


90660 


aatgattaaa 


atttgaggca 


ttactacatt 


tgttttcagc 


aaatgggcct 


ttctattccc 


90720 


ttaaaatcaa 


accctcataa 


ctatgggttt 


gctgacaaag 


ggaaactagt 


ttttactctt 


90780 
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attatatgga 


gattttaaat 


ctgcagagat 


gaaaataatt 


tgctgtttca 


gctgggtgcg 


90840 


gtggctcatg 


cctgtaatct 


cactactttg 


ggaggctgtg 


gcgggtggat 


cacctgaggt 


90900 


caggagttcg 


agaccagcct 


gaccaacatg 


gcgaaacgcc 


atctatacta 


aatacaaaaa 


90960 


aaaaattagc 


caggtgcggt 


ggcgcatgcc 


tataatccca 


gctacctgag 


aggctgaggt 


91020 


aggagaatcg 


ctccaggagg 


tggagatcac 


agtgagctga 


gatcatgcca 


ttgcactcca 


91080 


gcctgggcaa 


caagagcaaa 


actccatctc 


aaaaaaaagc 


gggaggggaa 


ataatt ? tgct 


91140 


gtttcttcct 


tcccttcctc 


agaatgactg 


atggatactc 


aggaagtgac 


ctaacagctt 


91200 


tggcaaaaga 


tgcagcactg 


ggtcctatcc 


gaggtaggta 


tacaagagct 


taaaacattt 


91260 


agaactattt 


attataccac 


cttagaagtt 


taagaagtcc 


aaaaaaatct 


accaagagat 


91320 


tttttttttc 


ttttggagac 


agggtctcac 


tctgttgccc 


aggctgtagt 


gcagtggcac 


91380 


aatcatagtt 


cactgcagcc 


tcgaaccccc 


caggctcagg 


tgattctccc 


acccagcctt 


91440 


cccagtagct 


gggactacag 


gcatgcacca 


tcatgcccag 


ataattattt 


tattttattt 


91500 


cttgtagaga 


cagggtttca 


ccatgttgcc 


caagctggtc 


ttgaactccc 


gggctcaagt 


91560 


gagcagcctg 


ccttggcctc 


ccaaagtgct 


gggattacag 


gcatgagcca 


ccatgcccag 


91620 


ccttaaaacc 


attcttagct 


cacagatcat 


acaaaaacag 


tctatgagcc 


agtagactgt 


91680 


gacccctgtt 


ctaggcaaga 


ggtttcattt 


cttgatagta 


agtaagcagc 


agaaaactca 


91740 


aaaagaaaac 


tttaaacaaa 


aaagaataat 


gtaaggaaaa 


tgttcttatc 


tgttttctgg 


91800 


ctcttttcag 


tattctgaca 


tcatttgaaa 


ttaatgtgtc 


taaaggaaat 


tctataagag 


91860 


aagttttcac 


ttttttaatt 


atatcttttg 


agggattgca 


gcaaaatatt 


tattgctatg 


91920 


tttttattca 


ggttacttgg 


ttgattctga 


aataccacga 


ccaattcttt 


ttaggttagg 


91980 


ttaggataaa 


ctcacacaga 


tattttcagc 


tacatttcca 


cagccagcat 


cggtagtgga 


92040 


tggttgatgc 


tctcaggtat 


gcactcagat 


tattagctat 


gatgataaag 


taatcataat 


92100 


agctccatcc 


ctttctctca 


ttcaagaaag 


tacaattgaa 


tgtagttgta 


cgagaaagat 


92160 


gttatcatag 


tgtctactgt 


aatttgcatt 


aaaagcctac 


attatacaaa 


cctttttgtt 


92220 


ttactagtta 


aaaattacca 


gtaacacctc 


ccgtagtgaa 


atagggtgct 


gattaagaac 


92280 


tgctactttg 


caaaataaaa 


aatgtaatct 


tgagagtata 


ttttgaaact 


ctggatgaac 


92340 


aaattttctt 


gctgctggag 


cttaaatctt 


gttcagttag 


tggatttaga 


aacagtagct 


92400 


aatgcataaa 


tgagttgtat 


tttcttagaa 


cgttttggct 


attctaaggt 


agacaaaatt 


92460 


tgggtttaaa 


aaaagattcg 


catccattaa 


agtacagaaa 


atggccgggt 


gcagtggctc 


92520 


acacctataa 


tcccagcact 


ttgggaggcc 


aaggtgggag 


gatcgtgtgg 


gcctaatagt 


92580 
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ttgagactag 


actgggcaac 


atagggagat 


cctgtctcta 


caaaaaaata 


taataaatta 


92640 


accaggcccg 


ttggcatgag 


cctgtaatcc 


cagctactcg 


ggagtctgaa 


gtaggaggat 


92700 


cacttgagcc 


tggaaggtgc 


aggcagcagt 


gagccatggt 


catgccactc 


actgcactcc 


92760 


agcctgggtg 


ggtgacatag 


tgaggtgctg 


tcttaaaaag 


taaataaata 


ggccaggcac 


92820 


ggtggctcac 


gcctgtaatc 


ccagcacttt 


gggaggccaa 


gatgggtgga 


tcatgaggtc 


92880 


aggagttcga 


gaccagcttg 


gccaatatgg 


tgaaaccgca 


tctctactga 


aaatacaaaa 


92940 


attagccagg 


cgtggttgtg 


cgcacctgta 


atcccagcta 


ctcaggaggc 


tgaggcagga 


93000 


gtatcgcttg 


aacctgggag 


gtgaggttgc 


agtaagccga 


gcactgcagc 


ctgggcaaca 


93060 


gagcaagact 


ctgtctcaaa 


aaaaaaaaaa 


aaaaaaaaaa 


aaaaaagtaa 


atacataaag 


93120 


tgcagagtaa 


aaacaaaaaa 


agactaatgc 


attttgtaaa 


gaacaagttg 


cattctttta 


93180 


agttcccttt 


caaatttgtg 


aactattgtt 


tttgggcagt 


atgcaagaaa 


ttgaacactt 


93240 


tccagttatt 


ccaaagaagg 


aatattctct 


tctcagcatt 


tataaattgt 


atttgctctc 


93300 


aaagttaaca 


tgtgtctctt 


ttttttaata 


taatgatttg 


tactgaatag 


atacatgtag 


93360 


atcattgtac 


ttggttttgc 


ccttcaacaa 


tttcaactgc 


aaaatgtatg 


tatttttaag 


93420 


tgcctgactt 


ttatgtttta 


cagaactaaa 


accagaacag 


gtgaagaata 


tgtctgccag 


93480 


tgaggtatag 


tattttacaa 


tgatattttc 


tttgtcttct 


atattgtaag 


acatatataa 


93540 


gacatacata 


tatgaatgtg 


tgtgtgtgtg 


gttttttttt 


tttttttttt 


ttttttgaga 


93600 


cagtctggca 


tgatatcggc 


tcactgcaac 


ctccacctcc 


tggattcaag 


ctattctcct 


93660 


gcctcagcct 


cccaagtagc 


tacaggcatg 


taccaccaag 


cccagctaat 


ttttgtattt 


93720 


ttagtagaga 


gggcatttca 


ccatgttggc 


cagtctggcc 


tcagactcct 


gacctcaagt 


93780 


gatccaccca 


actcggcctc 


ccaaagtgct 


gggattacag 


gcttgagccg 


ctgcatctgg 


93840 


ctgttttgtt 


tgtttgtttg 


tttgtttgtt 


tgtttgagac 


ggagtctcac 


tctgtcgccc 


93900 


agactggagt 


gcagtggtgc 


gatctcagct 


cactgcaagc 


tctgcctccc 


gggttcacgc 


93960 


cattctcctg 


cctcagcctc 


cctagtagct 


gggactacag 


gcgcccacca 


ccacgcctgg 


94020 


ctaatttttt 


gtacttttag 


tagagacggg 


gtttcaccgt 


gttagccagg 


atggtctctg 


94080 


tctcctgatc 


tcgtgatctg 


cctgcctcag 


cctcccaaag 


tgctgggatt 


acaggcgtga 


94140 


gccactgcgc 


ccggcctttt 


tttttttttt 


tttttgagac 


acagggtctt 


gctctgttct 


94200 


caggctggag 


tgcagtggtg 


caatcgtggc 


tgactgtagc 


cttgacctct 


tggtctcaag 


94260 


cagtcctctt 


gtctcaaact 


ttttagtagc 


tgggactaca 


ggcaagtgcc 


acaacgcccc 


94320 


actaattttt 


taattttctg 


tagagatggt 


gtctctccct 


gttgcccagg 


gtggtctcag 


94380 



actcttggcc 


tcaagtaatc 


ctcctgcctc 


agtctctcag 


agtgcttggg 


actaattttt 


94440 


tttaatggat 


ttttctagtt 


gattagaagc 


tagaaaaaat 


taactttgct 


tcatttcaaa 


94500 


atatggaaac 


ctatgaaata 


gtcaaaattt 


tttttggtaa 


tagacaaaac 


atatatacat 


94560 


aaagtcattt 


tctatcaaat 


catattacat 


aaataccaaa 


cagaagaaaa 


ttacaggccg 


94620 


ggtgcggtgg 


ctcacgcctg 


taatcccagc 


actttgggag 


gccgaggtgg 


gcagatcact 


94680 


tgaggtcagg 


agttcaagac 


cagcctggcc 


aacatggtga 


aaccctgtct 


ctatcaaaaa 


94740 


tacaaaaaaa 


ttaggccggg 


ggcggtggct 


cacacctgta 


atcccagcac 


tttgggaggc 


94800 


cgaggcgggc 


ggatcacgag 


gtcaggagat 


cgagaccatg 


ctggctaaca 


tggtgaaacc 


94860 


ctgtctccac 


taaaaaatac 


aaaaaaatta 


ccggggcgtg 


gtggcgggca 


cctgtagtcc 


94920 


cagctacttg 


ggaggctgag 


gcaggagaat 


ggcgtgaacc 


tgggaagtgg 


agcttgcagt 


94980 


gagccgagat 


cgtgccactg 


cactccagcc 


tgggcgacag 


agcaagactc 


catctcaaaa 


95040 


aaaaaaaaaa 


atagctgggc 


atggtggcac 


gtgcctgtgg 


tcctggctac 


ttgggaagct 


95100 


gaggcaggag 


aatcacttga 


acttgggagg 


cagaggttgc 


agtgagccaa 


gattgcccca 


95160 


ttgcactcta 


gcctgggcga 


cagagtgaga 


cccagtctca 


aaaaaaaaaa 


aattacatga 


95220 


aacttgtggg 


ggtttataca 


ataaaaataa 


cctataacta 


tacgttaatc 


ctttaataat 


95280 


gttctatttt 


gtttttcaat 


aacctttatt 


tttttaatta 


atttcttttt 


tttgagaagg 


95340 


actctggctc 


tgtcacccag 


gctgcagtgc 


agtggcacca 


tcttggctca 


ctgcagcctc 


95400 


cacctcccag 


gttcaagcga 


ttctcctgcc 


tcagcctcct 


gcgtagctga 


gattacaggc 


95460 


atgggccacc 


acgcccagct 


aatttttttt 


ttttttgtat 


ttttagtaga 


gatggggttt 


95520 


cactatgttg 


gccaggtggg 


tctcgaactc 


ctgacctcag 


gcgatcgcca 


gcctcggcct 


95580 


ccctaagtgc 


aaggattaca 


ggcgtgagcc 


accatgcctg 


gccaatttat 


taccgtttct 


95640 


taatatggaa 


gacctcctta 


tgagatgctg 


aagcatttca 


tttgaaaaaa 


gttgcatgta 


95700 


aaatataaaa 


ttgggtatgc 


agaatggtca 


taactctgtg 


agcaaaattt 


tgaaatcagg 


95760 


cttgaattac 


agtcagcctt 


ttctatccgt 


ggattctgca 


ttcatggatt 


caaccaactg 


95820 


cagatcaaaa 


atacttgggg 


gaaaaaagca 


tctgtgttga 


acatgtacag 


acttttattc 


95880 


fctattattat 


tccctaaaca 


atatagtata 


aaaactattt 


acattgcatt 


tacattgtat 


95940 


taggtgttat 


aagtaatcta 


gagatgattt 


aaagtataca 


ggaggattgt 


gtaggttgta 


96000 


tgcaaatact 


gcaccatttt 


acataaggga 


ctttaagcgt 


ttgcggattt 


tgctatctat 


96060 


gggggaacca 


atttccgaga 


gatactgagg 


gacagctgta 


tatttgtaac 


ttatttttta 


96120 


tttccctaat 


tgcagcagct 


gttgagggga 


cagtgaactg 


ttaacacaga 


taacaagtgt 


96180 
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attcaagtac 


attttggagt 


ttgtttgttt 


ttttttttca 


ggcttttatt 


cgcctgtcgg 


96240 


atgaggcacc 


atacttgaat 


tttttttttt 


aagaaagctt 


ttagttttct 


ttctttcttt 


96300 


tttttttttt 


gtgagatgga 


gtcttgctct 


gtttctaggc 


tggagtggag 


tgcagtggtg 


96360 


tgatctcagc 


tcactgcaac 


ctccgcctac 


tgggttcaag 


tgattctcct 


gcctcagcct 


96420 


cccgagtagc 


tgggactaca 


ggtgcacgcc 


accacgccca 


gctaattttt 


tttttttttt 


96480 


tttttttttg 


tatttgtagt 


agagacagag 


tttcaccatg 


ttggccagga 


tggtctcgat 


96540 


ctcctgacct 


tgggatccgc 


ccaccttggc 


ctcccaaagt 


gctagggatt 


acaggcatga 


96600 


gccaccacgc 


ccggctgaaa 


gcttttagtt 


ttctaactta 


tttaatttaa 


tttaatttaa 


96660 


tttattttta 


ttttattttt 


tgggacagtg 


tctcacttgg 


ttgcccaggc 


tggagtgcag 


96720 


tggtacaatc 


atggctcact 


gcaccctcta 


gctcctgggc 


tcaggcaatc 


ctcctgcctc 


96780 


agccttttga 


gttgctggga 


ctacgggcat 


gtaccaccac 


actcagctaa 


atttttaatt 


96840 


ttttgtagag 


atggggtctc 


actatgttgc 


ctaggctggt 


ctcagattcc 


tcaagcattc 


96900 


ctcccacttg 


cacctcccaa 


aatgctggga 


ttacaggtgt 


gacaccgtgc 


cagacttgaa 


96960 


atttttaatc 


ccacacctaa 


aaatataatt 


ttatccacca 


ttttttaaaa 


gtcataacat 


97020 


tatttattaa 


aaatttagat 


ggtaaaacta 


aaaattaaag 


cttaataaaa 


ctactgagtg 


97080 


atttacaagg 


aagaatatta 


ctggtccctt 


ttgtgagcat 


cccattaatt 


atatatattc 


97140 


aggttatatt 


gttacaatat 


ttggttctac 


tgtatacttt 


tttttttgag 


actgagtttc 


97200 


gctgttgttg 


cccaggctgg 


agtgcaatgg 


tgcaatctcg 


gctcactgca 


acctccgcct 


97260 


cctgggttca 


agtgattctc 


ctgcctcagc 


ctcctgagta 


gctgggatta 


caggcatgcg 


97320 


ccactatgcc 


tggctaattt 


tgtgtttttg 


tagagacggg 


gtttcactat 


gttggtcagg 


97380 


ctgatctgga 


actcccaacc 


tcaggagatc 


cgcccacctc 


ggcctcccaa 


agtgctggga 


97440 


ttgcaggtgt 


gagccaccat 


gcctggctct 


actatatact 


ttcattcagt 


tgtttctttt 


97500 


taatctagtg 


gttttggtat 


taataatttg 


ataatgacct 


ttagctgtta 


ttgcttactt 


97560 


atgagttaat 


atttataaag 


cacttaaagt 


agctggcacg 


tagtaaacac 


tatgtaaaga 


97620 


tccattaaat 


aactttaaaa 


aatataaaac 


tgatagtggc 


attttattat 


agagattaag 


97680 


gtaatccatt 


ctctcatttc 


catttatggg 


atgagacgta 


aacacaagta 


gtttgctctc 


97740 


taaaactgta 


tactagaatt 


ttatataccc 


attatttgat 


gcaactttaa 


taccaaagtg 


97800 


tattgtcagt 


taccggtgaa 


tatatataaa 


tttaggtaag 


gaaaacccaa 


cttggtcgca 


97860 


cacagtggct 


cacgcctgta 


atcctaccac 


tttgggaggc 


cgaggcagtt 


ggatcacctg 


97920 


aggtcttgag 


ttcgagacca 


gcctggccaa 


cgtggcgaaa 


ccccgtctcc 


actaaaaata 


97980 
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caaaaattag 


ccgggcgtgg 


tggcacatgc 


ctgtaatccc 


agctgctcgg 


gaggctgagg 


98040 


aaggagaatt 


gcttgaacct 


ggggaggtgg 


aggttgcagt 


gagctgagat 


cgtaccactg 


98100 


cactccagtc 


tgtgcgacag 


gagcgagact 


ccatctccaa 


aaaaaaaaaa 


aagaaaaacc 


98160 


caacttatct 


tttacagttt 


ataatagtag 


aagttcaaat 


aattggtttg 


gaatttctgt 


98220 


atttttaagg 


ttagtactaa 


aattgttggt 


tataaattgg 


ggtacaatat 


actttgtttt 


98280 


ttaagtacct 


tgtgtatcta 


atttaacttt 


aagtccttta 


ttattttggt 


ttgataagac 


98340 


aacttttcta 


cttatttccc 


cccttaactg 


aaccagctac 


catctgcctt 


tttcctgttg 


98400 


tatacattag 


tctcttacgt 


taaaatatca 


tataagtttc 


atatatatac 


acatatcaaa 


98460 


ctatagactt 


aaagtacaat 


tacatcaaca 


tcttttaaaa 


ccttaatttc 


tggccaggcg 


98520 


tggttgttca 


tgcctataat 


cccagcactt 


tgggaggctc 


aggccattgg 


atcccttgag 


98580 


ctcaggaatt 


cgagaccagc 


ctggataaca 


tggtgaaatc 


ctcatctcta 


caaaaattac 


98640 


aaaaagttag 


ctgggcgtgg 


tggcgcacac 


ctatagtcct 


agctacttgg 


gaggatctct 


98700 


taagcctggg 


aggcagaggt 


tgcagtgagc 


cgagatcatg 


ccactgcact 


ccagcctggg 


98760 


taacagtgag 


accctgtctc 


aaaacaaaaa 


tattaatttc 


tataacaaat 


aaattttatt 


98820 


tagtaatatc 


atgtttaata 


cccatgttac 


attcattatt 


cttctacact 


ttggccttta 


98880 


ggaagaggca 


gtgtgtgtgt 


tacagttaaa 


taggaaacaa 


gtagggttca 


tatagtgctt 


98940 


atggggtttt 


ctttggtggg 


gggttgctgg 


gtttttgggg 


tttttttttt 


tgagacaggg 


99000 


tatcactctg 


tctcccaggc 


tgaaatacat 


tggcatgctc 


atggctcact 


gcagcctcaa 


99060 


cctcccagac 


tcaagtgatc 


ctcccacctc 


agcttcccta 


gtagctgaga 


ctacaggcgt 


99120 


gcgccaccat 


gcctagctaa 


attttgtaca 


ttttgtagag 


atgaggcttt 


gccatgttgc 


99180 


ccaggctggt 


ctctaactcc 


tgggctcaag 


tgatccactt 


gcttcagcct 


cccaaagttc 


99240 


tgggattaac 


aggtgcgagc 


cactgcagcc 


agcctatatt 


ttaactatat 


gtttttttct 


99300 


ttttggctaa 


aatttttcag 


attagtttac 


aagttacaag 


tgtaggtgat 


atctcatgga 


99360 


gatatcaaag 


atgatatgaa 


gttagattgg 


gtttttaaga 


gtagttttta 


aaatacggat 


99420 


aaataccagt 


tgttggagtt 


ttgtttaaag 


ttctttaact 


tcttattttt 


gggccaaaat 


99480 


acaggtatac 


gctagaaatg 


atttttaaca 


caggtcattt 


atgccaaact 


gcattttgcc 


99540 


ttaatttttt 


tttttttttt 


tttttttgag 


agggagtctc 


actcattgcc 


caagctggag 


99600 


tgcaatggca 


cgatctcggc 


tcacttacaa 


cctccacctc 


ccaggttcaa 


gcgattctcc 


99660 


tgcctcagcc 


tcctgagtag 


ctgggattac 


aggcacctgc 


ctggctaatt 


tttgtatttt 


99720 


tagtggagac 


ggggtttcac 


catgttggcc 


aggctggtct 


cgaactgctg 


acctcaggtg 


99780 
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atccacccgc 


cttggcctcc 


caaagtgcgg 


ggattacagg 


tgtgagccac 


cgtgcttggc 


yyo4 u 


caaaattttt 


attaattttt 


ctattgcctg 


gactctgtga 


acctatccat 


tttgcctttt 


yy y uu 


aaaaatactt 


aggtgtaaat 


atagatattc 


attaactcag 


cattgtttta 


atctatattt 


99960 


ccaaaggcaa 


tttaaaagat 


cagaaaataa 


gaccaaatta 


atataaaaat 


gcatacttta 


100020 


ggctgggcaa 


agtggctcac 


gtctgtaatc 


ccagcacttt 


gggaggccaa 


ggtgggcgga 


-i a rt rt Q f\ 

10008 0 


tcacctgagg 


ttaggagttc 


aggaccaacc 


tggccatcat 


ggcgaaaccc 


tgtctctact 


100140 


aaaaatacaa 


aaattagctg 


ggcatggagg 


catgtgcctg 


taatcccagc 


tactcgggag 


100200 


gctgagacag 


aagaattgct 


tgaaccttgg 


agggggaggt 


tgcatatctg 


agtggtgaaa 


100260 


ttgtgattct 


ttttttctct 


ttgtctgtat 


ttttgaactt 


ttctataaat 


gattgtgttt 




tgtttttata 


ttggaaaaat 


attatgcttt 


caaatgttaa 


tacctatgaa 


actaaacaca 


IUUjoU 


agtaataaat 


atattagtat 


agcatttatt 


aaggtttctt 


gtgtagcaga 


tcaacataga 


100440 


aaatatattt 


aaatggctga 


cataattttc 


taagaataca 


tacacgtata 


Am A- J. ^ A— — J— — — 

ttttttataa 


lOOoUO 


cattaagaaa 


cagcagcatc 


attactttaa 


tccatcattt 


cgttaaccac 


catatacctg 


rt c ^ 

100560 


ttgatcattt 


gtattgtcat 


gtgcttttta 


aaaatctaga 


tgagaaatat 


Am ^ A_ a A— ~- X- 

tcgattatct 


lOQoZU 


gacttcactg 


aatccttgaa 


aaaaataaaa 


cgcagcgtca 


gccctcaaac 


tttagaagcg 


lUUbo u 


tacatacgtt 


ggaacaagga 


ctttggagat 


accactgttt 


aaggaaatac 


_- X» ^_ ^_ X_ mm. - 

ctttgtaaac 


1 f\rtT il ft 

100740 


ctgcagaaca 


ttttacttaa 


aagaggaaac 


acaagatctt 


caatgaacgt 


catcggctac 


lUUBUU 


agaaacagcc 


taagtttaca 


ggacttttta 


gagtcttaca 


tatttgtgca 


ccaaacttga 


lUUofoU 


agatgaacca 


gaaaacagac 


ttaaacaaaa 


tatacaatgc 


aaatgtaatt 


ttttgttgtt 


luuyzu 


taaggccttg 


ccttgatggt 


cacagttatc 


ccaatggaca 


ctaagttaga 


gcacaacaaa 




acctgattct 


ggtcttcttt 


accaatataa 


tcataatgta 


aataataatt 


tgtatattgt 


1U1U4 U 


gttgcagatg 


aaagtattcc 


aggaacagtg 


aatggtagaa 


gacacaagaa 


catttgtttg 


J.U11UU 


tttgtcttct 


gatgtttttt 


cttaaaatag 


taatttctcc 


tacttttctt 


a i * _. X- X_ 

ttctactgtt 


101160 


gtcttaacta 


caggtgattg 


gaatgccaaa 


cactcttaag 


i_ X. X_ X_ X- ^» Xt 

tttattttct 


4- 4- 4— 4- 4* ^ 4- 4- 

tttttcgttt 




tataaattca 


gtgtgccaaa 


tgaaactttt 


ttcctaagta 


actgtaatag 


gaaaaagttt 




attttgagag 


tttcttcttc 


ataaatctac 


agacattaaa 


caattgttgt 


gttcttttta 


101340 


ccttttattt 


ttctattacc 


ttgctaccaa 


acagtttaga 


tagcaatata 


atagcaaaaa 


101400 


agcaaatatg 


gtaaaataga 


gaaggtttga 


aggtttgagt 


tactctgtca 


tataacatgt 


101460 


agatcagtct 


tcatgtgacc 


tgcagtattt 


ttttttctaa 


tgtatttgtc 


agaaatctgt 


101520 


tgtagactgt 


taacttcttc 


ctgatggaat 


ttattttctg 


caagaattat 


tctgatattt 


101580 
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aagagagcca 


attttaactg 


ctgtgaaaat 


gtttccagtg 


caagagaagg 


gaaatactag 


101640 


gaactaagac 


atttctaatt 


tattgcttat 


tactttctta 


attttacagg 


ataattataa 


101700 


gcaagtggaa 


ctaccatctt 


ttattcttaa 


taattattaa 


tcccttcaat 


gaaactttaa 


101760 


aaaaactgaa 


tttttataca 


tggcatacat 


ttttctagtt 


ccttctgctt 


gctttattaa 


101820 


ctcaaaagtt 


ctagttctag 


tctgttgatc 


tgccttttgt 


tctcccaaaa 


tgtacagtaa 


101880 


ttccatttgt 


ttgtataaat 


atgcctggat 


tttcattata 


aaaatgtcat 


tgtagggagt 


101940 


agagactcat 


atcatggcct 


tttaaatatt 


gtaataaagg 


caaatagata 


tttgccctta 


102000 


gtttactggt 


taaaagtttg 


tttacagaac 


ttttctctgg 


tgcttaaatg 


atgctatgta 


102060 


aaatgtcatg 


agtggaaaga 


atatttgtag 


tagtaacaag 


aatttttcat 


ttaggaaaga 


102120 


tttcttaggt 


tttgaaagaa 


tacattaaaa 


taaaaaactt 


gcccctacta 


ggtaagaact 


102180 


ttataatgaa 


gacatacatt 


cttcttaatt 


ttactcttgc 


tcttgttaaa 


gatttgtttg 


102240 


aatatagaag 


atgcatgatt 


tctgggtttt 


tttttttttt 


tgagacagag 


tttcgctctt 


102300 


gttgcccagg 


ctggagtgca 


atggcgcaat 


ctcgactcac 


cacaacctcc 


gcctcccagg 


102360 


ttcaagcaat 


tctcctgcct 


cagcctcccg 


agtagctggg 


attacaggca 


tgcgccacta 


102420 


ccccagctaa 


ttttgtattt 


ttagtagaga 


tggggtttct 


ccatgttggt 


caggctggtc 


102480 


ttgaactcct 


gacctcaggt 


gatccgcctg 


cctcggcctc 


ccaaagtgct 


gggattacag 


102540 


gcataagcca 


ctgcgcccag 


ccagaagatg 


catgatttct 


taggatcata 


tgctgtttgt 


102600 


agccataagg 


taaatcatgt 


ctcttccaat 


catgactttg 


gaactccctg 


aataataaaa 


102660 


atgagagttg 


agataaatag 


gggaaaaaaa 


atttttttca 


agccagagct 


atgcatatgt 


102720 


taggtgatgg 


gtagtatccc 


tttaaggtct 


caaacattac 


aacatcaatt 


atgaaatact 


102780 


gataacgaaa 


ggtagtaatg 


aaatatatat 


gatgaaaaga 


attgagaagt 


tctaaattaa 


102840 


gacatttcag 


ttaagctcat 


aaaatttcat 


tgttttcatt 


taaaagatta 


acgttattga 


102900 


tacttggata 


actggctaat 


catattaaag 


gactatgtgg 


ttccagctca 


acttttaata 


102960 


tattgtctcc 


tttaaaacta 


tcatggttat 


aattctattg 


ggaaagactt 


ttagataaca 


103020 


aagatttcaa 


atgttaaaag 


agataaaagt 


caggttaata 


ctatcttaaa 


cactgagtca 


103080 


gaaaatcatt 


actgtataga 


agttgctttc 


ctgatcaagt 


ctgaacttca 


gctagtgcta 


103140 


gagaactatt 


ttctatgact 


taactctaac 


caagttttat 


tttaagctgt 


ttctttgata 


103200 


gaagggccat 


gaaaatagag 


taatgatata 


gtaggagata 


agggattggt 


ttggtctttt 


103260 


tcaataaaga 


tagaagttgc 


tgaagttttc 


tgaattaata 


atgacttaga 


ttgtgacctt 


103320 


ttagattcgg 


tgttgagctc 


tgtgttgtat 


tacttcctaa 


aagataatgc 


ttaaacatta 


103380 
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a oca t tacit a 


tgctcttcat 


gttaatatgg 


cagagttttg 


taaactaaat 


taaaacttac 


103440 


fcaatatattci 


gactttgagc 


caagggaaag 


aatgagtact 


atctttccag 


atatcttaag 


103500 




tattctaaga 


cagtctgtcc 


attgagaata 


ttagatttct 


gaettgeaaa 


103560 


t-atotttata 


ctccagaaga 


attagaggaa 


aagcagatac 


tagaattcta 


atttaattac 


103620 




gtctttgttt 


atagtgtaga 


attctttata 


ttttgtacaa 


aaactaattc 


103680 


fctttaataaa 


atgaaccatt 


tacagttegg 


ttttggactc 


tgagtcaaag 


gatttticctt 


103740 


taaatacttcr 


tctcaatttt 


agtctggtct 


tttgtacttt 


tcttcagaag 


aaatgaatta 


103800 




ttgcataaag 


tgggttttta 


tcctaatgta 


ttggaaataa 


atgataaact 


103860 


ttattttatc 


tttacttttt 


tactttaaaa 


ctttttgata 


ttttaggggt 


tggagtctga 


103920 




a t t at a tat a 


ttggactctt 


agtaacaatt 


ataaacgett 


aacaaaatat 


103980 


^ fia a an caa t 


aattqcrcftgg 

3 *"T?y y w 3 3 


etctgeagag 


caatcaaaac 


aaggtagaaa 


ctgcaaagtc 


104040 


rfataatacra 


agagattcag 


gctgggtgtg 


gtggctcatg 


cctgtttggg 


aggecagtat 


104100 


rrrrrra naatca 


cttacactca 


ggaattcaag 


accagcctgg 


ggaatatagg 


gagaccctgt 


104160 




aaaaaaaaaa 


aaaaaaaaac 


taaactaaaa 


attagecagg 


tttggtggcc 


104220 




crtcccaatta 


ctcaagaggc 


tgaggttaga 


ggategctta 


agecegggag 


104280 


era acra a cr 1 1 o 


cagtgageca 


agatcacacc 


accacactcc 


ageccaggtt 


acagagaacc 


104340 


tatctcaaaa 


aataaaaagt 


aaacgagatt 


caccttaacc 


agcttttacc 


catagggcaa 


104400 


tttccaattt 


gtgcagttca 


cttggatata 


gaattcaggt 


agaatgtgac 


agttttgaca 


104460 




tcatttcrcrcra 


cttctagaac 


acctgaaaat 


tagaagagaa 


attttgggaa 


104520 




tcagaaagta 


agctctaaaa 


tctgcctaca 


tattcctttc 


aaatccttgg 


104580 




aattotccto 


atacaatatcj 


attatttaaa 


ggaacccagg 


agaaagcaag 


104640 


ttaaaatcta 


aaaaactcag 


cagegattge 


agctgcccaa 


ggacagagag 


tttgaaattc 


104700 


aacrttccact 


aagaaggact 


gagtaaatac 


ttggtgtttc 


ccattgaacc 


cccaaaatgc 


104760 


y-> 3 ofirrttaa 


aaaaaaatoa 


cagcatccta 


gaactaaagg 


ctgtgcttca 


gcactaagga 


104820 


d d d L>^^au 


ataaacttac 


tgtaatgaag 


cttaaaatca 


aatctcacag 


catcaaggtt 


104880 


atccattagt 


aatttaaaac 


cagaacaaaa 


cacagcattc 


ttgagaagaa 


aacaa t ccag 




tcatcacagc 


atatatccaa 


agctcagtac 


ataataaaca 


gttactaagc 


atgcaaagaa 


105000 


aaattatgtg 


atccttttga 


ctcaacttcc 


ctgatggaaa 


aaaaaaagtg 


gtccatacca 


105060 


tactcaacag 


aaaatataca 


gaagcagatg 


cacaagtgac 


ctctatgaga 


gtgattttaa 


105120 


aatagcgtta 


aaatatgtta 


aaagaattta 


caagaagaga 


taatgggtga 


atagataggg 


105180 
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agtttcagca 


gaaaaataag 


aattgaaaac 


ccaacagagg 


ccaggcaccg 


tgcctcacgc 


105240 


ccgtaatcac 


agcactttgg 


gaggccaagg 


caggtggatc 


acctaaggtc 


aggagttcaa 


105300 


gaccagcctg 


accaacatgg 


tgaaacccgg 


tctctactaa 


aaatacaaaa 


ctagccgggc 


105360 


atgggtgatg 


catgcccata 


atcctagcta 


cttgggaggc 


tgaagcagga 


gaattgcttg 


105420 


aacctgggag 


gtagaggttg 


cagtgaacca 


agatcatgcc 


attgcactcc 


agcctgggca 


105480 


agaagagcaa 


aactccatct 


caaaaaataa 


taataataat 


tggctgggcg 


cggtgg'ctca 


105540 


cgcctgtaat 


cccagcactt 


tgggaggccg 


agacaggcag 


atcacaaggt 


caggagattg 


105600 


agaccatcct 


ggctaacatg 


gtgaaacccc 


gtctctacta 


aaaatacaaa 


aaattagcct 


105660 


ggcatggtgg 


cgggcacctg 


tagtcccagc 


tactcgggag 


gctgaagcag 


gagaatggca 


105720 


tgaccccagg 


aggcggaact 


tgcaatgagc 


ccagatcgcg 


ccactgcact 


ccagcctggg 


105780 


caaccgtctc 


aaaaataata 


ataataataa 


ttagaaaata 


ataaaaaata 


acccactgga 


105840 


aagtcttgta 


atgaaaacta 


cagtatctga 


aattaaaaat 


ttaaatggat 


ggacttaaca 


105900 


gtaaactagg 


cacaacagga 


aagactgaaa 


aagacaagta 


agtatcaaac 


caaagcagag 


105960 


agagaaagaa 


aaaagaaata 


gcagaggttt 


gagacctttg 


gaacattatc 


agttcctgta 


106020 


atttgaagta 


aagaaggaaa 


ggaagagaat 


ggggcaagag 


aaatctttga 


agcaatgatg 


106080 


cgtgaaattt 


tccccaaagt 


gttgaaagac 


atcaacgtac 


agatctaaga 


agttcactga 


106140 


atccccaagc 


agaataaata 


caacaaagac 


tacatctggg 


tacatcacat 


tgccaaaaaa 


106200 


aaaaaaaaaa 


aaaatcttaa 


aagcaatcaa 


ggtggggagt 


gggaaggagt 


agcattacat 


106260 


tcagataaac 


aagagtgatg 


gctaacctca 


tcagaaatga 


tggaattaag 


aaaatgatgg 


106320 


aatgacatct 


ttaaggtgca 


aagatgaaac 


aaaggttaac 


ttaaaactct 


gtatccagtt 


106380 


aaaatatcct 


tcaagatgtt 


aaggcaatgg 


ccaggctcag 


tggcttatgc 


ctgtaatccc 


106440 


aacactttgg 


ggggctgaga 


caggagaatc 


ccttgaggcc 


atgagtgacc 


agcctgggca 


106500 


acctagtgag 


aaccccatca 


aaaaataaaa 


ttagctgggc 


atgggctgtg 


gtcgtgctac 


106560 


tgcactccag 


cctgggggac 


agagtcccta 


tctcttgaaa 


aacttaagac 


aaaatctttt 


106620 


ccagatgaaa 


acagaatttg 


ttgctggcag 


actgacttta 


tacggaatgc 


tttaagaaat 


106680 


tcttcaggct 


gaaggaaaat 


ataaatctgg 


agtgaaaaac 


gtagtatctg 


aaattaaaat 


106740 


tttccttgga 


tggacttatc 


agtaaatgga 


tttcccaatg 


ggaacctgta 


tctccaggat 


106800 


ggaattaaga 


attttgaaat 


gataaacatg 


ttggtaaata 


agaaagacat 


ttttcttttt 


106860 


tatttttcta 


aatatcattg 


ctgtttaaag 


caaacaaaaa 


tagtattgca 


gtgtttataa 


106920 


tatatgtata 


agtaaaatat 


aggacagaaa 


tagcatgaag 


ggtcagagag 


ggcaataaat 


106980 
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gtaattatat 


fcgagataata 




>*r 4~ a * a *^a a a 

g LaCaCada^ 


tgaga tag ci 


4- 4~ 2i i-r 4^ /-* +■ a a /t 

L» uciy uy Lad^ 


1 0704 n 


gtagattgtg 


ataagaatgc 


a 4- 4- 4- 4- /-» 4- a f 

dCtLtgUaaL 




a LCauLgggg 


4" /~t a ^t4" s /~f a */■ 

uy i^cty L^cty ci 


i 071 on 


ctaaaaagcc 


attagagaag 


ataaaatggg 


tcactaagaa 


ttatgtgatt. 


agtcaaa tga 


i m i fin 


aatcaaggaa 


agaaaaacag 


agcaaagaag 


ugtaagataa 


aacagtggga 


tggaagagct. 


i moon 


gaaattaata 


atgtcactaa 


A 4>* 4V .« 4 1- ^ 4 

attgcttacc 


4* 4^ y-^4™ a 4* 4— /«* 


4— ^ ^ 4— 4— 4— 

cty ddCtg ut 


/ -»4-/-TrTa4-1-+-4-4- 

gtggat.tttt 




tttttttcag 


ggggttgagg 


4-t-+--t-+-+-t-4-'t-a 

ttttitttta 


yagaCagayL. 


4- ^4-4- « 

CLCLaLLgUvJ 


r*r+st ti ft i^>'i" /r*"f a 
UUdy (jctggd 




cagcagtggc 


A* A. <k 4™ jte — 4* 

gtaatcagtc 


ccaaaatccc 


uy cay ucucq 


o ^ +" ^ +■ nf^rr 
aaQLCCLgyy 


ttcaay ty a t 


1 07400 


cctcctgcct 


cggcctccca 


aaat.gct.ggg 


a 4* 4* a a a 
o uLaCaggca 


y CJ Coy ay Cua 


t>t'Cii v .oit_i>^>^. ty 


1 074 fiO 


ccagaactat 


tgt tttaaag 


tcattaggtg 




^^ra a a ^ ff 

cgayaCtatg 


4- j^t a a r-r +* 4- 4- y^r 

Lgcaagtctg 


n 07SP0 


atgattcgtt 


aggagcactc 


acaggactca 


>v a a ^ a ^ a 4"^ /m 

gcatatagtc 


4^ 4" a 4" ^ ^ a a 


Caat^oLLtd 


1 07«^ft0 


ttagagcaaa 


aggatatgaa 


gcaaattcag 


caaagggaaa 


aaaggaacta 


agtgaagtcc 




agaggaaacc 


aagcaccagc 


ttctaagggt 


4" 4» -4-" 4— « ^ 

tctctcctaa 


tgaagtcaca 


j— • ^ f+ a 4— f- y-^ ^ 

CaggauguCo 


1 07700 


ctccagcaac 


aagtgacagc 


atgtgaaagt 


gtcaagcctc 


a I - « 4* 4* a a ^» 

actgutagac 


a 4~ a r*r 4* a a /t z^ 1 4^ 

dtdyldagct 


1 077fi0 


tgttagggaa 


tagagggaat 


ctcccctcaa 


a t tcaag ttc 


ccagatgcc t 


x*r /-^ 3, a /*y /t /*y 

ggcaagggcc 


1 07RP0 


aaccttgcca 


gcaggacttt 


ctggggatag 


cagtcccagg 


cacgtgtttg 


cacagtggiu 


1 07RR0 


cagatcaatg 


tgcttacatt 


gggtagaggg 


gacctatgga 


agtccaaau t 


tgggtg tcag 


1 07Q4 0 


agacctaata 


gggtgaagac 


agtgtctaca 


atgatggaca 


gctagg t.a tg 


aggt-gt-cagg 


1 0R000 
X uouuu 


gacagattga 


_ ^ ^ A _*4* 4* n 4> 4* 

ggcagttatt: 


cacatggtgg 


ataggggcaa 


ccuggaa uga 


nrw a a +^ a^ a rtnt" 

ggaatadgcu 


1 0R060 


caagcacaga 


aaggggtgtc 


catatggggt. 


a.oy y y uy c Ccl 


gcagaga tgg 


"t - a na 4- 4- rr/*r 4- 4- 
La^at L>y y 1 1 


108120 


gcacaccaaa 


gacttgatgg 


aa taaagtga 


a 4* a 4" a 4— ^ ^ « 


r^a /*^a n a a 
CaCdgagaag 


y LddLUaUctd 


108180 

X V V X V V/ 


atacagaaag 


gggggaaact 


agaatgaaac 


Cuggagtcca 


gcLtgaatcg 


^r^r+T 4~ 4" ^ #<ra a 

ygtt.ta.ayaa 


1 08940 


agtgaattca 


tggtttaaaa 


4-» y+ 4- a 4^ a a a ^ — ^ 


a 4" a a t^ - 
Ldgd LgdaaC 


a t y l. y y y 




108300 


cacgcatata 


atcccagcac 


tttgggaggc 


cgaggcgggc 


agaccgct tg 


agatcaggdg 


1 08^60 
X u o uu 


tttgagacca 


gcctggccaa 


ca ctgcgaaa 


ccccatctct 


a y*f 4~ a a a a a 4~ a 
a^LaaaaaLa 


f*aaaaa^+*4^a /T 
CaaaadL t-ay 


1 0R49O 


ccaggtgtgg 


tggtacacac 


ctgtagtccc 


agctacttgg 


gaggctgagg 


a ^"ra a 4~ 
CaCgagdaLC 


1 084 RO 


acttgaacct 


gggaggcaga 


ggttgcagtg 


ggctgagatc 


gcaccactgc 


actccagcct 


108540 


gggcaacaga 


gcgagatcct 


gcctcaaata 


aaaatagagg 


acatataagc 


atataaatat 


108600 


acacgtgtgt 


atgtgtccaa 


atatgtatat 


tccctagtct 


gtccaccaag 


gtggccttgg 


108660 


agcagttatg 


ctccaataat 


aatgagcaca 


taaagtaccc 


atatcttgcc 


ttccaaattc 


108720 


ttcactgtct 


tagtctgctt 


gggctgcatt 


acaaaatacc 


atagactggg 


cagcttaaat 


108780 
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aacagaaatt 


tatcctcaca 


gttctagaag 


cttggaagtc 


caagattaaa 


gtaccagcca 


108840 


gtttggtttc 


tagtgagggc 


tttcttcctg 


gcttgcagat 


ggccaccttc 


tcaccgtgtc 


108900 


cttgtatggc 


agacagcaca 


agctctctgg 


tgtccctttt 


taaaagggca 


ttaatcccat 


108960 


catgacagtc 


ccatcctcat 


tatctcatct 


aaccctaggt 


acttcccaaa 


ggctgaatca 


109020 


ccaaagacca 


tcacattgct 


ggtgaaggct 


tcaacatatg 


aatttgaggg 


acacgaatat 


109080 


tcagtccata 


acatcaacta 


aaggaaccaa 


gactctttga 


taaaatggct 


aaattcaggg 


109140 


ctggggcaga 


gaaaatacat 


gagtgtggaa 


cttcttgtgc 


cagagagaaa 


aagtgcccaa 


109200 


agattgatga 


ggatgaatca 


ttgaaatgac 


acacagatta 


aaagggttcc 


cactggacaa 


109260 


atttgagcat 


caaaataagt 


aatagtagta 


attaattata 


acccatcaga 


agaaataaac 


109320 


catgagctca 


tgtgaatata 


tgaatacaaa 


cataaacaaa 


ttacaagcat 


aatgaggaat 


109380 


gtgatattta 


tatggtttaa 


aggtacctct 


ccaggccggg 


tgcagtaact 


ctcacctgta 


109440 


atcccagcac 


tttgggaggc 


caaggcaggt 


agatcacctg 


aggtcaggca 


tttgagacca 


109500 


gcctgcacaa 


catggtgaaa 


ccctgactct 


actaaaaata 


cataacgcga 


gccgggcgtg 


109560 


gtggcacgtg 


tctataatct 


gccactgatt 


aggtgtgtga 


ttttcccaag 


caggggataa 


109620 


tagtagtacc 


tatgtcaaag 


gctgttatga 


ggattaaatg 


agctaacaca 


taatcgtgct 


109680 


tttttttttt 


tttttttttt 


ttgagacaga 


gtcttgcact 


gtcgcctggg 


ctggagtgca 


109740 


atggcacgat 


ctcggcccac 


tgcaacctct 


gcctcccagg 


ttcaagtgat 


tctcctgcct 


109800 


cagcctcctg 


agtagctggg 


attacaggct 


cctgccacca 


cacctggcta 


ttttcaatag 


109860 


agacggggtt 


tcactatgtt 


ggccaggcta 


gtctcaaaaa 


cctgacctcg 


tgatccaccc 


109920 


gctttggcct 


cccaaagtgc 


tgggattaca 


ggcatgagcc 


actgcacccg 




iuy you 


tttttttttg 


agatggaatc 










110000 


<210> 2 

<211> 3263 

<212> DNA 

<213> Homo sapiens 












<400> 2 
gctcctgaga 


ccggcgggca 


cacgggggtc 


tgtggccccc 


gccgtagcag 


tggctgccgc 


60 


cgtcgcttgg 


ttcccgtcgg 


tctgcgggag 


gcgggttatg 


gcggcggcgg 


cagtgagagc 


120 


tgtgaatgaa 


ttctccgggt 


ggacgaggga 


agaagaaagg 


ctccggcggc 


gccagcaacc 


180 


cggtgcctcc 


caggcctccg 


cccccttgcc 


tggcccccgc 


ccctcccgcc 


gccgggccgg 


240 


cccctccgcc 


cgagtcgccg 


cataagcgga 


acctgtacta 


tttctcctac 


ccgctgtttg 


300 


taggcttcgc 


gctgctgcgt 


ttggtcgcct 


tccacctggg 


gctcctcttc 


gtgtggctct 


360 
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gccagcgctt 


ctcccgcgcc 


ctcatggcag 


ccaagaggag 


ctccggggcc 


gcgccagcac 


420 


ctgcctcggc 


ctcggccccg 


gcgccggtgc 


cgggcggcga 


ggccgagcgc 


gtccgagtct 


480 


tccacaaaca 


ggccttcgag 


tacatctcca 


ttgccctgcg 


catcgatgag 


gatgagaaag 


540 


caggacagaa 


ggagcaagct 


gtggaatggt 


ataagaaagg 


tattgaagaa 


ctggaaaaag 


600 


gaatagctgt 


tatagttaca 


ggacaaggtg 


aacagtgtga 


aagagctaga 


cgccttcaag 


660 


ctaaaatgat 


gactaatttg 


gttatggcca 


aggaccgctt 


acaacttcta 


gagaagatgc 


720 


aaccagtttt 


gccattttcc 


aagtcacaaa 


cggacgtcta 


taatgacagt 


actaacttgg 


780 


catgccgcaa 


tggacatctc 


cagtcagaaa 


gtggagctgt 


tccaaaaaga 


aaagacccct 


840 


taacacacac 


tagtaattca 


ctgcctcgtt 


caaaaacagt 


tatgaaaact 


ggatctgcag 


900 


gcctttcagg 


ccaccataga 


gcacctagtt 


acagtggttt 


atccatggtt 


tctggagtga 


960 


aacagggatc 


tggtcctgct 


cctaccactc 


ataagggtac 


tccgaaaaca 


aataggacaa 


1020 


ataaaccttc 


tacccctaca 


actgctactc 


gtaagaaaaa 


agacttgaag 


aattttagga 


1080 


atgtggacag 


caaccttgct 


aaccttataa 


* tgaatgaaat 


tgtggacaat 


ggaacagctg 


1140 


ttaaatttga 


tgatatagct 


ggtcaagact 


tggcaaaaca 


agcattgcaa 


gaaattgtta 


1200 


ttcttccttc 


tctgaggcct 


gagttgttca 


cagggcttag 


agctcctgcc 


agagggctgt 


1260 


tactctttgg 


tccacctggg 


aatgggaaga 


caatgctggc 


taaagcagta 


gctgcagaat 


1320 


cgaatgcaac 


cttctttaat 


ataagtgctg 


caagtttaac 


ttcaaaatac 


gtgggagaag 


1380 


gagagaaatt 


ggtgagggct 


ctttttgctg 


tggctcgaga 


acttcaacct 


tctataattt 


1440 


ttatagatga 


agttgatagc 


cttttgtgtg 


aaagaagaga 


aggggagcac 


gatgctagta 


1500 


gacgcctaaa 


aactgaattt 


ctaatagaat 


ttgatggtgt 


acagtctgct 


ggagatgaca 


1560 


gagtacttgt 


aatgggtgca 


actaataggc 


cacaagagct 


tgatgaggct 


gttctcaggc 


1620 


gtttcatcaa 


acgggtatat 


gtgtctttac 


caaatgagga 


gacaagacta 


cttttgctta 


1680 


aaaatctgtt 


atgtaaacaa 


ggaagtccat 


tgacccaaaa 


agaactagca 


caacttgcta 


1740 


gaatgactga 


tggatactca 


ggaagtgacc 


taacagcttt 


ggcaaaagat 


gcagcactgg 


1800 


gtcctatccg 


agaactaaaa 


ccagaacagg 


tgaagaatat 


gtctgccagt 


gagatgagaa 


1860 


atattcgatt 


atctgacttc 


actgaatcct 


tgaaaaaaat 


aaaacgcagc 


gtcagccctc 


1920 


aaactttaga 


agcgtacata 


cgttggaaca 


aggactttgg 


agataccact 


gtttaaggaa 


1980 


atacctttgt 


aaacctgcag 


aacattttac 


ttaaaagagg 


aaacacaaga 


tcttcaatga 


2040 


acgtcatcgg 


ctacagaaac 


agcctaagtt 


tacaggactt 


tttagagtct 


tacatatttg 


2100 


tgcaccaaac 


ttgaagatga 


accagaaaac 


agacttaaac 


aaaatataca 


atgcaaatgt 


2160 



aattttttgt 


tgtttaaggc 


cttgccttga 


tggtcacagt 


tatcccaatg 


gacactaagt 


2220 


tagagcacaa 


caaaacctga 


ttctggtctt 


ctttaccaat 


ataatcataa 


tgtaaataat 


2280 


aatttgtata 


ttgtgttgca 


gatgaaagta 


ttccaggaac 


agtgaatggt 


agaagacaca 


2340 


agaacatttg 


tttgtttgtc 


ttctgatgtt 


ttttcttaaa 


atagtaattt 


ctcctacttt 


2400 


tcttttctac 


tgttgtctta 


actacaggtg 


attggaatgc 


caaacactct 


taagtttatt 


2460 


ttcttttttc 


gttttataaa 


ttcagtgtgc 


caaatgaaac 


ttttttccta 


agtaactgta 


2520 


ataggaaaaa 


gtttattttg 


agagtttctt 


cttcataaat 


ctacagacat 


taaacaattg 


2580 


ttgtgttctt 


tttacctttt 


atttttctat 


taccttgcta 


ccaaacagtt 


tagatagcaa 


2640 


tataatagca 


aaaaagcaaa 


tatggtaaaa 


tagagaaggt 


ttgaaggttt 


gagttactct 


2700 


gtcatataac 


atgtagatca 


gtcttcatgt 


gacctgcagt 


attttttttt 


ctaatgtatt 


2760 


tgtcagaaat 


ctgttgtaga 


ctgttaactt 


cttcctgatg 


gaatttattt 


tctgcaagaa 


2820 


ttattctgat 


atttaagaga 


gccaatttta 


actgctgtga 


aaatgtttcc 


agtgcaagag 


2880 


aagggaaata 


ctaggaacta 


agacatttct 


aatttattgc 


ttattacttt 


cttaatttta 


2940 


caggataatt 


ataagcaagt 


ggaactacca 


tcttttattc 


ttaataatta 


ttaatccctt 


3000 


caatgaaact 


ttaaaaaaac 


tgaattttta 


tacatggcat 


acatttttct 


agttccttct 


3060 


gcttgcttta 


ttaactcaaa 


agttctagtt 


ctagtctgtt 


gatctgcctt 


ttgttctccc 


3120 


aaaatgtaca 


gtaattccat 


ttgtttgtat 


aaatatgcct 


ggattttcat 


tataaaaatg 


3180 


tcattgtagg 


gagtagagac 


tcatatcatg 


gccttttaaa 


tattgtaata 


aaggcaaata 


3240 


gatatttgcc 


cttagtttac 


too 








3263 


<210> 3 

<211> 616 

<212> PRT 

<213> Homo sapiens 












<400> 3 














Met Asn Ser 
1 


Pro Gly Gly Arg Gly Lys 
5 


Lys Lys Gly 
10 


Ser Gly Gly Ala 
15 




Ser Asn Pro 


Val Pro Pro 
20 


Arg Pro Pro 
25 


Pro Pro Cys 


Leu Ala Pro Ala 
30 




Pro Pro Ala 
35 


Ala Gly Pro 


Ala Pro Pro 
40 


Pro Glu Ser 


Pro His Lys Arg 
45 




Asn Leu Tyr 
50 


Tyr Phe Ser 


Tyr Pro Leu 
55 


Phe Val Gly 
60 


Phe Ala Leu Leu 




Arg Leu Val 
65 


Ala Phe His 
70 


Leu Gly Leu 


Leu Phe Val 
75 


Trp Leu Cys Gin 
80 
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Arg Phe Ser Arg Ala Leu Met Ala Ala Lys Arg Ser Ser Gly Ala Ala 
85 90 95 

Pro Ala Pro Ala Ser Ala Ser Ala Pro Ala Pro Val Pro Gly Gly Glu 
100 105 110 

Ala Glu Arg Val Arg Val Phe His Lys Gin Ala Phe Glu Tyr lie Ser 
115 120 125 

lie Ala Leu Arg lie Asp Glu Asp Glu Lys Ala Gly Gin Lys Glu Gin 
130 135 140 

Ala Val Glu Trp Tyr Lys Lys Gly lie Glu Glu Leu Glu Lys Gly lie 
145 150 155 160 

Ala Val He Val Thr Gly Gin Gly Glu Gin Cys Glu Arg Ala Arg Arg 
165 170 175 

Leu Gin Ala Lys Met Met Thr Asn Leu Val Met Ala Lys Asp Arg Leu 
180 185 190 

Gin Leu Leu Glu Lys Met Gin Pro Val Leu Pro Phe Ser Lys Ser Gin 
195 200 205 

Thr Asp Val Tyr Asn Asp Ser Thr Asn Leu Ala Cys Arg Asn Gly His 
210 215 220 

Leu Gin Ser Glu Ser Gly Ala Val Pro Lys Arg Lys Asp Pro Leu Thr 
225 230 235 240 

His Thr Ser Asn Ser Leu Pro Arg Ser Lys Thr Val Met Lys Thr Gly 
245 250 255 

Ser Ala Gly Leu Ser Gly His His Arg Ala Pro Ser Tyr Ser Gly Leu 
260 265 270 

Ser Met Val Ser Gly Val Lys Gin Gly Ser Gly Pro Ala Pro Thr Thr 
275 280 285 

His Lys Gly Thr Pro Lys Thr Asn Arg Thr Asn Lys Pro Ser Thr Pro 
290 295 300 

Thr Thr Ala Thr Arg Lys Lys Lys Asp Leu Lys Asn Phe Arg Asn Val 
305 310 315 320 



Asp Ser Asn Leu Ala Asn Leu He Met Asn Glu He Val Asp Asn Gly 
325 330 335 

Thr Ala Val Lys Phe Asp Asp He Ala Gly Gin Asp Leu Ala Lys Gin 
340 345 350 

Ala Leu Gin Glu He Val He Leu Pro Ser Leu Arg Pro Glu Leu Phe 
355 360 365 

Thr Gly Leu Arg Ala Pro Ala Arg Gly Leu Leu Leu Phe Gly Pro Pro 
370 375 380 



Gly Asn Gly Lys Thr Met Leu Ala Lys Ala Val Ala Ala Glu Ser Asn 
385 390 395 400 



t 
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Ala Thr Phe Phe Asn lie Ser Ala Ala Ser Leu Thr Ser Lys Tyr Val 
405 410 415 

Gly Glu Gly Glu Lys Leu Val Arg Ala Leu Phe Ala Val Ala Arg Glu 
420 425 430 

Leu Gin Pro Ser lie lie Phe lie Asp Glu Val Asp Ser Leu Leu Cys 
435 440 445 

Glu Arg Arg Glu Gly Glu His Asp Ala Ser Arg Arg Leu Lys Thr Glu 
450 455 460 

Phe Leu lie Glu Phe Asp Gly Val Gin Ser Ala Gly Asp Asp Arg Val 
465 470 475 480 

Leu Val Met Gly Ala Thr Asn Arg Pro Gin Glu Leu Asp Glu Ala Val 
485 490 495 

Leu Arg Arg Phe lie Lys Arg Val Tyr Val Ser Leu Pro Asn Glu Glu 
500 505 510 

Thr Arg Leu Leu Leu Leu Lys Asn Leu Leu Cys Lys Gin Gly Ser Pro 
515 520 525 

Leu Thr Gin Lys Glu Leu Ala Gin Leu Ala Arg Met Thr Asp Gly Tyr 
530 535 540 

Ser Gly Ser Asp Leu Thr Ala Leu Ala Lys Asp Ala Ala Leu Gly Pro 
545 550 555 560 

lie Arg Glu Leu Lys Pro Glu Gin Val Lys Asn Met Ser Ala Ser Glu 
565 570 575 

Met Arg Asn lie Arg Leu Ser Asp Phe Thr Glu Ser Leu Lys Lys lie 
580 585 590 

Lys Arg Ser Val Ser Pro Gin Thr Leu Glu Ala Tyr lie Arg Trp Asn 
595 600 605 

Lys Asp Phe Gly Asp Thr Thr Val 
610 615 

<210> 4 
<211> 23 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 4 

cggagctcct cttggctgcc atg 23 

<210> 5 
<211> 26 
<212> ADN 

<213> Artificial Sequence 



<220> 



<223> Amorce 



<400> 5 

agaagcgctg gcagagccac acgaag 

<210> 6 
<211> 27 
<212> ADN 

<213> Axtificial Sequence 
<220> 

<223> Amorce 
<40O> 6 

aaggcgacca aacgcagcag cgcgaag 

<210> 7 
<211> 26 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 7 

aggagcaagc tgtggaatgg tataag 

<210> 8 
<211> 27 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 8 

tggttatggc caaggaccgc ttacaac 

<210> 9 
<211> 26 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 9 

caaacggacg tctataatga cagtac 

<210> 10 
<211> 25 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 10 

ttaggaatgt ggacagcaac cttgc 



<210> 11 
<211> 25 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 11 

cttctctgag gcctgagttg ttcac 

<210> 12 
<211> 27 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 12 

tgctagaatg actgatggat actcagg 

<210> 13 
<211> 24 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 13 

agatgcagca ctgggtccta tccg 

<210> 14 
<211> 26 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 14 

atgaacgtca tcggctacag aaacag 

<210> 15 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 15 

tagcagtggc tgccgccgt 

<210> 16 
<211> 20 
<212> ADN 

<213> Artificial Sequence 



<220> 

<223> Amorce 
<400> 16 

aagcggtcct tggccataac 

<210> 17 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 17 

ggcggcagtg agagctgtg 

<210> 18 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 18 

ctagctcttt cacactgttc 

<210> 19 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 19 

aacaggcctt cgagtacatc 

<210> 20 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 20 

ctgtgaacaa ctcaggcctc 

<210> 21 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<400> 21 



atgagaaagc aggacagaag 

<210> 22 
<211> 18 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 22 

tgccaagtct tgaccagc 

<210> 23 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 23 

ctacaactgc tactcgtaag 

<210> 24 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 24 

cagtgctgca tcttttgcc 

<210> 25 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 25 

taggaatgtg gacagcaacc 

<210> 26 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 26 

aaagctgtta ggtcacttcc 



<210> 27 
<211> 20 



<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 27 

tggagatgac agagtacttg 

<210> 28 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 28 

ctggaatact ttcatctgc 

<210> 29 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 29 

atgaggctgt tctcaggcg 

<210> 30 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 30 

gtgagccgaa ctgcacattg 

<210> 31 
<211> 21 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 31 

caaagtcgac agctacagtg c 

<210> 32 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 



t 
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<223> Amorce 
<400> 32 

ggaactgtag ttgagtggga 

<210> 33 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 33 

agatgaggct ccgacctac 

<210> 34 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 34 

aatgccacac ttgtaatctc 

<210> 35 
<211> 22 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 35 

tgtgaatata tcataatttg gg 

<210> 36 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 36 

tacagcagtt ctcatgatg 

<210> 37 
<211> 21 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<400> 37 

gaccaaattg gtgcatgcat g 



21 
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<210> 38 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 38 

acatttccaa tacatcccac 20 

<210> 39 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<210> 40 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 40 

ttagaatgac tatacctgac 20 

<210> 41 
<211> 18 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<210> 42 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 42 

ttcctatcta cctagtgac 19 

<210> 43 
<211> 20 
<212> ADN 

<213> Artificial Sequence 



<400> 39 

atttgtcatt tcacatgcac 



20 



<400> 41 

tcaggttaag taagactc 



18 



<220> 

<223> Amorce 
<400> 43 

ttttatagca agttgccctg 

<210> 44 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 44 

cctatgaaga tcctggtac 

<210> 45 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 45 

tgtcatgatt ctaacaaggg 

<210> 46 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 46 

tctatttcac tcctgacatg 

<210> 47 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 47 

gtcatagggc ttaggcttc 

<210> 48 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 



<400> 48 



atcatactac ccacttttcc 



<210> 49 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 49 

tgtttgggaa gatgctactg 

<210> 50 
<211> 21 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 50 

ctactgaaga taacgtacat g 

<210> 51 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 51 

cattgattgc catgtattgg 

<210> 52 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 52 

agaaggccag aaatactcag 

<210> 53 
<211> 22 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 53 

gtacttaaat cggtaaatat gg 



<210> 54 
<211> 20 



<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 54 

ctcaagtctt aggaatgcag 

<210> 55 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 55 

gcacttaacc aggctgtatg 

<210> 56 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 56 

ctcagatgac tcacatagc 

<210> 57 
<211> 22 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 57 

ctttactaga ctaattctcc tg 

<210> 58 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 58 

cagattcaag aagacagatc 

<210> 59 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 



<223> Amorce 
<400> 59 

gcaataattc accacacttg 

<210> 60 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 60 

ggtagttctt gtttctgctc 

<210> 61 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 61 

caagtgtggt gaattattgc 

<210> 62 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 62 

gagctgaaaa gtattcagc 

<210> 63 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 63 

tgcaaaggac atagccagtg 

<210> 64 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 64 

agcctctgga gatagtatgc 



<210> 65 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 65 

ctagaacagg ggtcacagtc 

<210> 66 
<211> 18 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 66 

ttggacttct taaacttc 

<210> 67 
<211> 21 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 67 

gcagtatgca agaaattgaa c 

<210> 68 
<211> 19 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 68 

ggcctgtaat tttcttctg 

<210> 69 
<211> 21 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 69 

gtactgaata gatacatgta g 

<210> 70 
<211> 19 
<212> ADN 

<213> Artificial Sequence 



<220> 

<223> Amorce 
<400> 70 

gtgtagcaga tcaacatag 

<210> 71 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 71 

catcttcaag tttggtgcac 
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REVENDICATIONS 



1. Acide nucleique purifie ou isole du gene SPG4, caracterise en ce qu'il 
comprend au moins 15 nucleotides consecutifs d'une sequence choisie parmi le 

5 groupe comprenant la sequence SEQ ID No. 1, les sequences nucleiques homologues 
ou variantes de I'acide nucleique de sequence SEQ ID No. 1, leur sequence 
complementaire et la sequence de leur ARN correspondant 

2. Acide nucleique purifie ou isole selon la revendication 1 1 caracterise en 
ce qu'il comprend une sequence choisie parmi le groupe comprenant la sequence SEQ 

10 ID No. 1, la sequence SEQ ID No. 2, la sequence SEQ ID No. 72, les sequences 
nucleiques homologues ou variantes des sequences SEQ ID No. 1, SEQ ID No. 2 ou 
SEQ ID No. 72, leur sequence complementaire et la sequence de leur ARN 
correspondant. 

3. Acide nucleique purifie ou isole selon la revendication 1 ou 2, 
15 caracterise en ce qu'il comprend au moins une mutation dont la position et la nature 

sont identifiees au tableau 5. 

4. Sonde ou amorce, caracterisee en ce qu'elle comprend une sequence 
d'un acide nucleique selon Tune des revendi cations 1 a 3. 

5. Sonde ou amorce selon la revendication 4, caracterisee en ce que sa 
20 sequence est choisie parmi les sequences SEQ ID No. 4 a SEQ ID No. 71. 

6. Site accepteur ou donneur d'epissage, caracterise en ce que sa 
sequence est choisie parmi les sequences de sites accepteurs ou donneurs d'epissage 
identifiees au tableau 3. 

7. Methode pour le criblage de banques d'ADNc ou d'ADN genomique ou 
25 pour le clonage d'ADNc ou genomique isole codant pour la spastin, caracterisee en ce 

qu'elle met en ceuvre une sequence nucleique selon I'une des revendications 1 a 6. 

8. Methode selon la revendication 8, pour ('identification de la sequence 
genomique ou de I'ADNc du gene SPG4 de mammifere, notamment de souris. 

9. Methode pour ('identification de mutation portee par le gene SPG4 
30 humain, caracterisee en ce qu'elle met en ceuvre une sequence nucleique selon I'une 

des revendications 1 a 6. 

10. Methode selon la revendication 9, pour ('identification de mutation 
responsable de la paraplegie spastique familiale autosomique dominante. 
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11. Methode pour I'identification des sequences d'acide nucleique 
promotrices et/ou regulatrices de Texpression du gene SPG4, caracterisee en ce 
qu'elle met en ceuvre une sequence nucleique selon Tune des revendications 1 a 6. 

12. Acide nucleique identifie par une methode selon Tune des 
5 revendications 8 a 12. 

13. Polypeptide code par un acide nucleique selon Tune des revendications 
1 a 3 et 12. 

14. Polypeptide selon la revendication 13, caracterise en ce qu'il comprend 
une sequence d'acides amines choisie parmi le groupe comprenant la sequence SEQ 

10 ID No. 3, la sequence SEQ ID No. 73, les sequences de polypeptides homologues et 
variants du polypeptide de sequence SEQ ID No. 3 ou SEQ ID No. 73 t et les 
sequences de leurs fragments d'au moins 10 acides amines consecutifs. 

15. Polypeptide selon la revendication 14, caracterise en ce qu'il comprend 
une sequence d'acides amines choisie parmi le groupe comprenant la sequence SEQ 

15 ID No. 3 et la sequence SEQ ID No. 73, lesquelles sequences portant au moins une 
des mutations dont la nature et la localisation sont identifies au tableau 5, et les 
sequences de leurs fragments d'au moins 10 acides amines consecutifs. 

16. Vecteur de clonage et/ou d'expression contenant une sequence d'acide 
nucleique selon Tune des revendications 1 a 3, et 12. 

20 17. Vecteur selon la revendication 16, caracterise en ce qu'il comporte les 

elements necessaires a son expression dans une cellule hote. 

18. Cellule hote transformee par un vecteur selon la revendication 16 ou 17. 

19. Mammifere, excepte I'Homme, caracterise en ce qu'il comprend une 
cellule selon la revendication 18. 

25 20. Mammifere, excepte I'Homme, selon la revendication 16, comprenant 

une cellule transformee, caracterise en ce que la sequence de Tun au moins des deux 
alleles du gene SPG4 contient une au moins des mutations dont la position et la nature 
sont identifies au tableau 5 ou identifies par une methode selon la revendication 8 ou 
9. 

30 21. Utilisation d'une sequence d'acide nucleique selon I'une des 

revendications 4, 5 et 12 comme sonde ou amorce, pour la detection et/ou 
('amplification de sequences d'acide nucleique. 

22. Utilisation d'une sequence d'acide nucleique selon I'une des 
revendications 1 a 6, et 12, pour le criblage de banque genomique ou d'ADNc. 
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23. Utilisation d'une sequence d'acide nucleique selon Tune des 
revendications 1 a 3, et 12, pour la production d'un polypeptide recombinant ou 
synthetique. 

24. Methode de production d'un polypeptide recombinant, caracterisee en 
5 ce que Ton cultive une cellule transformee selon la revendication 18 dans des 

conditions permettant I'expression dudit polypeptide recombinant et que Ton recupere 
ledit polypeptide recombinant 

25. Polypeptide, caracterise en ce qu'il est obtenu par une methode selon la 
revendication 24. 

10 26. Anticorps mono- ou polyclonaux ou leurs fragments, anticorps 

chimeriques ou immunoconjugues, caracterises en ce qu'ils sont capables de 
reconnaitre specifiquement un polypeptide selon Tune des revendications 13 a 15, et 
25. 

27. Methode pour la detection et/ou la purification d'un polypeptide selon 
15 Tune des revendications 13 a 15, et 25, caracterisee en ce qu'elle met en oeuvre un 

anticorps selon la revendication 26. 

28. Methode de diagnostic genotypique de la PSF-AD associee au gene 
SPG4, caracterisee en ce que Ton met en oeuvre une sequence d'acide nucleique 
seton Tune des revendications 1 a 6, et 12. 

20 29. Methode de diagnostic genotypique de PSF-AD associee a la presence 

d'au moins une mutation sur une sequence du gene SPG4 a partir d'un prelevement 
biologique d'un patient, caracterisee en ce qu'elle comporte les etapes suivantes : 
a) le cas echeant, tsofement de I'ADN genomique a partir de I'echantillon biologique a 
analyser, ou obtention d'ADNc a partir de I'ARN de I'echantillon biologique ; 
25 b) amplification specifique de ladite sequence d'ADN du gene SPG4 susceptible de 
contenir une mutation a ['aide d'amorces selon I'une des revendications 4 et 5 ou 
d'un acide nucleique selon la revendication 12 ; 
c) analyse des produits d'amplification obtenus et comparaison de leur sequence avec 
la sequence normale correspondante du gene SPG4. 
30 30. Methode de diagnostic de la PSF-AD associee a une expression 

anormale d'un polypeptide code par le gene SPG4, caracterisee en ce que Ton met n 
contact un ou des anticorps selon la revendication 26 avec le materiel biologique a 
tester, dans des conditions permettant la formation eventuelle de complexes 
immunologiques specifiques entre ledit polypeptide et I ou lesdits anticorps, et en ce 
35 que Ton detecte et/ou quanttfie les complexes immunologiques eventuellement formes. 



1* 
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31. Methode de selection d'un compose chimique ou biochimique capable 
d'interagir directement ou indirectement avec un polypeptide selon Tune des 
revendications 13 a 15, et 25, ou avec un acide nucleique selon I'une des 
revendications 1 a 6, et 12, et/ou permettant de moduler I'expression ou I'activite de 

5 ces polypeptides, caracterisee en ce qu'elle comprend la mise en contact d'une 
sequence d'acide nucleique selon Tune des revendications 1 a 6, et 12, d'un 
polypeptide selon Tune des revendications 13 a 15, et 25, d'un vecteur selon Tune des 
revendications 16 et 17, d'une cellule selon la revendication 18, d'un mammifere selon 
I'une des revendications 19 et 20 ou d'un anticorps selon la revendication 26, avec un 

10 compost candidat et, la detection d'une modification de I'activite dudit polypeptide. 

32. Utilisation d'une sequence d'acide nucteique selon I'une des 
revendications 1 a 6, et 12, d'un polypeptide selon I'une des revendications 13 a 15, et 
25, d'un vecteur selon I'une des revendications 16 et 17, d'une cellule selon la 
revendication 18, d'un mammifere selon I'une des revendications 19 et 20 ou d'un 

15 anticorps selon la revendication 26, pour I'etude de I'expression ou de I'activite du gene 
SPG4. 
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LISTE DE SEQUENCES 
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<130> D18374 

<160> 105 

<170> Patentln Vers. 2.0 

<210> 1 

<211> 110000 

<212> DNA 

<213> Homo sapiens 

<220> 
<221> exon 

<222> (9932) . . . (10471) 
<220> 

<221> intron 

<222> (10472) . . . (33718) 

<220> 

<221> exon 

<222> (33719) . . . (33805) 
<220> 

<221> intron 

<222> (33806) . . . (35748) 

<220> 
<221> exon 

<222> (35749) . . . (35832) 
<220> 

<221> intron 

<222> (35833) . . . (45022) 

<220> 
<221> exon 

<222> (45023) . . . (45118) 
<220> 

<221> intron 

<222> (45119) . . . (60863) 

<220> 
<221> exon 

<222> (60864) . . . (61051) 



<220> — s 
<221> intron 
<222> (61052) . . . (61927) 
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<220> 

<223> Amorce 
<400> 70 

gtgtagcaga tcaacatag 

* <210> 71 
<211> 20 
<212> ADN 

<213> Artificial Sequence 
<220> 

<223> Amorce 
<400> 71 

catcttcaag tttggtgcac 

<210> 72 
<211> 1689 
<212> ADN 
<213> souris 

<220> 

<223> ADN Spg4 incomplet. 
<400> 72 

aggccgagag cgtccgcgtc ttccacaagc 
gcatcgacga ggaagagaaa gcaggacaga 
gtatcgaaga actggaaaaa ggaatcgctg 
aaagagctag acgtcttcaa gccaaaatga 
tacaacttct agagaagctg caaccagttt 
ataacgagag tactaacctg acatgccgca 
ttccgaagag gaaagacccc ttaacacatg 
tcctgaaaag tggctccgca gggctctccg 
tgtccatggt ttctggagca agaccgggac 
ctccaaaacc aaatagaacc aacaaacctt 
aagacttgaa aaattttagg aatgtggaca 
ttgttgacaa tgggacagct gttaagtttg 
aagcgctgca ggagattgtc atccttcctt 
gagctcctgc tagaggcttg ttactcttcg 
ctaaagcagt agctgcagag tctaatgcga 
cttcaaaata tgtgg'gagaa ggagagaaat 
aacttcaacc atctataatt tttatagatg 
aaggggagca cgacgctagc agacggctaa 
tgcaatctgc tggagatgac agagtacttg 
ttgatgaagc tgttctcagg cgtttcatta 
agacaagact ccttctgctt aaaaacctgt 
aagaactcgc acagcttgct agaatgaccg 
tggccaagga tgcagccctg ggtcctatcc 
tgtctgccag tgagatgaga aatattcgat 
taaaacgcag tgtgagtcct cagaccttag 
gagacaccac tgtttaaagg aatggatgcc 
aggaaacaag agctttggct acaggaaccc 
tcatttttgt gcaccaaact tgaagaggaa 
tatgaatgg 



19 



20 



aggccttcga gtacatctcc attgccctgc 60 
aggaacaagc tgtggaatgg tataagaaag 120 
ttatagttac gggccaaggt gaacagtatg 180 
tgactaattt agttatggcc aaggaccgtt 240 
tgcaattttc caagtcacag acggacgtct 300 
atggacatct ccagtcagaa agtggagcag 360 
ctagtaattc attgcctcga tcaaaaactg 420 
gtcaccacag ggcgcctagt tgcagtggtt 480 
ctggtcctgc agctaccaca cataagggta 540 
ctactcccac aactgcagtt cggaaaaaga 600 
gcaatcttgc taaccttata atgaatgaaa 660 
atgacatagc cgggcaggag ctggcaaagc 720 
ctctgcggcc tgagttgttc acagggctca 780 
gtccgccagg aaacggaaaa acaatgctgg 840 
cctttttcaa cataagtgct gccagtttaa 900 
tggtgagagc tctctttgct gtggctcgag 960 
aagttgacag tcttttgtgt gagagacggg 1020 
agacggaatt tttaatagaa tttgacgggg 1080 
taatgggtgc aactaacagg ccccaagagc 1140 
aacgggtata tgtgtcctta ccaaatgagg 1200 
tgtgtaaaca aggaagtcca ctgacccaaa 1260 
atggatactc tggaagtgat ctgaccgctt 1320 
gagaactgaa gccagagcag gtgaagaata 1380 
tatctgactt cacagaatcc ttaaaaaaga 1440 
aagcatacat acgctggaac aaggattttg 1500 
tctgtgagcc catagaacat cgcacttcac 1560 
agacttcgtt tacaggacgt tttagagttt 1620 
caagaagaca gacctaaata aaatatgcaa 1680 

1689 



<210> 73 
<211> 504 
<212> PRT 
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<213> souris 
<220> 

<223> Spastin murine incomplete. 
<400> 73 

Ala Glu Ser Val Arg Val Phe His Lys Gin Ala Phe Glu Tyr lie Ser 
15 10 15 

lie Ala Leu Arg lie Asp Glu Glu Glu Lys Ala Gly Gin Lys Glu Gin 
20 25 30 

Ala Val Glu Trp Tyr Lys Lys Gly lie Glu Glu Leu Glu Lys Gly lie 
35 40 45 

Ala Val lie Val Thr Gly Gin Gly Glu Gin Tyr Glu Arg Ala Arg Arg 
50 55 60 

Leu Gin Ala Lys Met Met Thr Asn Leu Val Met Ala Lys Asp Arg Leu 
65 70 75 80 

Gin Leu Leu Glu Lys Leu Gin Pro Val Leu Gin Phe Ser Lys Ser Gin 
85 90 95 

Thr Asp Val Tyr Asn Glu Ser Thr Asn Leu Thr Cys Arg Asn Gly His 
100 105 110 

Leu Gin Ser Glu Ser Gly Ala Val Pro Lys Arg Lys Asp Pro Leu Thr 
115 120 125 

His Ala Ser Asn Ser Leu Pro Arg Ser Lys Thr Val Leu Lys Ser Gly 
130 135 140 

Ser Ala Gly Leu Ser Gly His His Arg Ala Pro Ser Cys Ser Gly Leu 
145 150 155 160 

Ser Met Val Ser Gly Ala Arg Pro Gly Pro Gly Pro Ala Ala Thr Thr 
165 170 175 

His Lys Gly Thr Pro Lys Pro Asn Arg Thr Asn Lys Pro Ser. Thr Pro 
180 185 190 

Thr Thr Ala Val Arg Lys Lys Lys Asp Leu Lys Asn Phe Arg Asn Val 
195 200 205 

Asp Ser Asn Leu Ala Asn Leu lie Met Asn Glu lie Val Asp Asn Gly 
210 215 220 

Thr Ala Val Lys Phe Asp Asp lie Ala Gly Gin Glu Leu Ala Lys Gin 
225 230 235 240 

Ala Leu Gin Glu lie Val lie Leu Pro Ser Leu Arg Pro Glu Leu Phe 
245 250 255 

Thr Gly Leu Arg Ala Pro Ala Arg Gly Leu Leu Leu Phe Gly Pro Pro 
260 265 270 



Gly Asn Gly Lys Thr Met Leu Ala Lys Ala Val Ala Ala Glu Ser Asn 
275 280 285 
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Ala Thr Phe Phe Asn He Ser Ala Ala Ser Leu Thr Ser Lys Tyr Val 
290 295 300 

Gly Glu Gly Glu Lys Leu Val Arg Ala Leu Phe Ala Val Ala Arg Glu 
305 310 315 320 

Leu Gin Pro Ser He He Phe He Asp Glu Val Asp Ser Leu Leu Cys 
325 330 335 

Glu Arg Arg Glu Gly Glu His Asp Ala Ser Arg Arg Leu Lys Thr Glu 
340 345 350 

Phe Leu He Glu Phe Asp Gly Val Gin Ser Ala Gly Asp Asp Arg Val 
355 360 365 

Leu Val Met Gly Ala Thr Asn Arg Pro Gin Glu Leu Asp Glu Ala Val 
370 375 380 

Leu Arg Arg Phe He Lys Arg Val Tyr Val Ser Leu Pro Asn Glu Glu 
385 390 395 400 

Thr Arg Leu Leu Leu Leu Lys Asn Leu Leu Cys Lys Gin Gly Ser Pro 
405 410 415 

Leu Thr Gin Lys Glu Leu Ala Gin Leu Ala Arg Met Thr Asp Gly Tyr 
420 425 430 

Ser Gly Ser Asp Leu Thr Ala Leu Ala Lys Asp Ala Ala Leu Gly Pro 
435 440 445 

He Arg Glu Leu Lys Pro Glu Gin Val Lys Asn Met Ser Ala Ser Glu 
450 455 460 

Met Arg Asn lie Arg Leu Ser Asp Phe Thr Glu Ser Leu Lys Lys He 
465 470 475 480 

Lys Arg Ser Val Ser Pro Gin Thr Leu Glu Ala Tyr He Arg Trp Asn 
485 490 495 

Lys Asp Phe Gly Asp Thr Thr Val 
500 

<210> 74 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site accepteur d'epissage du gene SPG4 . 
<400> 74 

attttttatt ttaaagcagg acag 24 



<210> 75 
<211> 24 
<212> ADN 

<213> Homo sapiens 
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<220> 

<223> Site 



accepteur d'epissage du gene SPG4. 



<400> 75 
aatttttttc 



tttcaggtga acag 



24 



<210> 76 

<211> 24 

<212> ADN 

<213> Homo sapiens 

<220> 

<223> Site accepteur d'epissage du gene SPG4 . 
<400> 76 

cttctctgtt gcatagagaa gatg 24 

<210> 77 

<211> 24 

<212> ADN 

<213> Homo sapiens 

<220> 

<223> Site accepteur d'epissage du gene SPG4 . 



<210> 78 

<211> 24 

<212> ADN 

<213> Homo sapiens 

<220> 

<223> Site accepteur d'epissage du gene SPG4. 
<400> 78 

ttttgtatcc tttaagggta ctcc 24 

<210> 79 

<211> 24 

<212> ADN 

<213> Homo sapiens 

<220> 

<223> Site accepteur d'6pissage du gene SPG4 . 
<400> 79 

aggtcttgtt tcttagtgga acag 24 

<210> 80 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site accepteur d'epissage du gene SPG4. 



<400> 77 
actttttcct 



tgtcagaaag tgga 



24 
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<400> 80 

agtatatatt ttttagttgt tcac 

<210> 81 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site accepteur d'epissage du gene SPG4. 
<400> 81 

cttgtgattt ttaaaggcta aagc 

<210> 82 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site accepteur d'epissage du gene SPG4. 
<400> 82 

taatgctttg ttttaggtgg gaga 

<210> 83 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site accepteur d'epissage du gene SPG4. 
<400> 83 

cttgtatttc ctctagatga agtt 

<210> 84 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site accepteur d'epissage du gene SPG4. 
<400> 84 

gattttttgc ttgtaggtac agtc 

<210> 85 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site accepteur d'epissage du gene SPG4 . 
<400> 85 

ggattttttt ttttaggcgt ttca 
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24 
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<210> 86 

<211> 24 

<212> ADN 

<213> Homo sapiens 

<220> 

<223> Site accepteur d'epissage du gene SPG4 
<400> 86 

ttttaatatt tttcagacaa gact 

<210> 87 

<211> 24 

<212> ADN 

<213> Homo sapiens 

<220> 

<223> Site accepteur d'epissage du gene SPG4 
<400> 87 

tccttccctt cctcagaatg actg 

<210> 88 

<211> 24 

<212> ADN 

<213> Homo sapiens 

<220> 

<223> Site accepteur d'epissage du gene SPG4 
<400> 88 

cttttatgtt ttacagaact aaaa 

<210> 89 

<211> 24 

<212> ADN 

<213> Homo sapiens 

<220> 

<223> Site accepteur d*epissage du gene SPG4 
<400> 89 

ctttttaaaa atctagatga gaaa 

<210> 90 

<211> 24 

<212> ADN 

<213> Homo sapiens 

<220> 

<223> Site donneur d'epissage du gene SPG4. 
<400> 90 

tgagaaaggt aactaggggg ctgg 

<210> 91 

<2H> 24 

<212> ADN 

<213> Homo sapiens 
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<220> 

<223> Site donneur d'epissage du gene SPG4 
<400> 91 

aggacaaggt aagattgtat ttgt 

<210> 92 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene SPG4 
<400> 92 

acttctaggt atcaattaat gtat 

<210> 93 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene SPG4 
<400> 93 

ccagtcaggt gggtttaggt taac 

<210> 94 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene SPG4 
<400> 94 

ctcataaggt attctgggac agta 

<210> 95 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene SPG4 
<400> 95 

gtggacaagt aagttttgcc atct 

<210> 96 
<211> 24 
<212> ADN 

<213> Homo sapiens 



<220> 

<223> Site donneur d'epissage du gene SPG4 
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<400> 96 

ggcctgaggt aagaacttta tatt 

<210> 97 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene SPG4 . 
<400> 97 

caatgctggt aagggttctc ttca 

<210> 98 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene SPG4. 
<400> 98 

caaaatacgt gagtgctctg tttc 

<210> 99 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene SPG4 . 
<400> 99 

ttttataggt aagaacatat tttc 

<210> 100 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene SPG4 . 
<400> 100 

ttgatggtgt aagtgttgat tatg 

<210> 101 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene SPG4. 
<400> 101 

gttctcaggt agggagattt atat 



24 



24 



24 



24 



24 
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<210> 102 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene SPG4 . 
<400> 102 

atgaggaggt atgtatctgt gttt 24 

<210> 103 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene SPG4. 
<400> 103 

cttgctaggt gagtaatttg gatt 24 

<210> 104 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene SPG4 . 
<400> 104 

tatccgaggt aggtatacaa gage 24 

<210> 105 
<211> 24 
<212> ADN 

<213> Homo sapiens 
<220> 

<223> Site donneur d'epissage du gene SPG4 . 



<400> 105 

ccagtgaggt atagtatttt acaa 



24 



-> * 
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REVENDICATIONS W* 8 * 



1. Acide nucleique purifie ou isole du gene SPG4, caracteris^ en ce qu'il 
comprend au moins 15 nucleotides cons6cutifs d'une sequence choisie parmi le 

5 groupe comprenant la sequence SEQ ID No. 1, les sequences nucieiques homologues 
ou variantes de I'acide nucleique de sequence SEQ ID No. 1, leur sequence 
compiementaire et la sequence de leur ARN correspondant. 

2. Acide nucleique purifie ou isole selon la revendication 1, caracterise en 
ce qu'il comprend une sequence choisie parmi le groupe comprenant la sequence SEQ 

10 ID No. 1, la sequence SEQ ID No. 2, la sequence SEQ ID No. 72, les sequences 
nucieiques homologues ou variantes des sequences SEQ ID No. 1, SEQ ID No. 2 ou 
SEQ ID No. 72, leur sequence compiementaire et la sequence de leur ARN 
correspondant. 

3. Acide nucleique purifie ou isole selon la revendication 1 ou 2, 
15 caracterise en ce qu'il comprend une mutation correspondant a un polymorphisme 

natural chez I'Homme. 

4. Sonde ou amorce, caracterisee en ce qu'elle comprend une sequence 
d'un acide nucleique selon Tune des revendications 1 a 3. 

5. Sonde ou amorce selon la revendication 4, caracterisee en ce que sa 
20 sequence est choisie parmi les sequences SEQ ID No. 4 a SEQ ID No. 71. 

6. Site accepteur ou donneur d'epissage, caracterise en ce que sa 
sequence est choisie parmi les sequences SEQ ID No. 74 a SEQ ID No. 105. 

7. Methode pour le criblage de banques d'ADNc ou d'ADN g§nomique ou 
pour le clonage d'ADNc ou g6nomique isole cod ant pour la spastin, caracterisee en ce 

25 qu'elle met en ceuvre une sequence nucleique selon Tune des revendications 1 a 6. 

8. Methode selon la revendication 7, pour I'identification de la sequence 
genomique ou de PADNc du gene SPG4 de mammifere, notamment de souris. 

9. Methode pour I'identification de mutation portee par le gene SPG4 
humain, caracterisee en ce qu'elle met en ceuvre une sequence nucleique selon Tune 

30 des revendications 1 a 6. 

10. Methode selon la revendication 9, pour identification de mutation 
responsable de la paraplegie spastique familiale autosomique dominante. 

11. Methode pour I'identrfication des sequences d'acide nucleique 
promotrices et/ou regulatrices de I'expression du gene SPG4 t caracterisee en ce 

35 qu'elle met en ceuvre une sequence nucleique selon I'une des revendications 1 a 6. 
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12. Acide nucleique identifie par une methode selon Tune des 
revendications 8 a 11. 

13. Polypeptide code par un acide nucleique selon Tune des revendications 
1 a3et 12. 

14. Polypeptide selon la revendication 13, caracterise en ce qu'il comprend 
une sequence d'acides amines choisie parmi le groupe comprenant la sequence SEQ 
ID No. 3, la sequence SEQ ID No. 73, les sequences de polypeptides homologues et 
variants du polypeptide de sequence SEQ ID No. 3 ou SEQ ID No. 73, et les 
sequences de leurs fragments d'au moins 10 acides amines consecutifs. 

15. Polypeptide selon la revendication 14, caracterise en ce qu'il comprend 
une sequence d'acides amines choisie parmi le groupe comprenant la sequence SEQ 
ID No. 3 et la sequence SEQ ID No. 73, lesquelles sequences portant au moins une 
des mutations correspondant a un polymorphisme nature! chez I'Homme, t les 
sequences de leurs fragments d'au moins 10 acides amines consecutifs. 

16. Vecteur de clonage et/ou d'expression contenant une sequence d'acide 
nucleique selon Tune des revendications 1 a 3, et 12, 

17. Vecteur selon la revendication 16, caracterise en ce qu'il comporte les 
elements necessaires a son expression dans une cellule note. 

18. Cellule note transformee par un vecteur selon la revendication 16 ou 17. 

19. Mammifere, excepte I'Homme, caracteris§ en ce qu'il comprend une 
cellule selon la revendication 18. 

20. Mammifere, excepte I'Homme, selon la revendication 19, comprenant 
une cellule transformee, caracterise en ce que la sequence de Tun au moins des deux 
alleles du gene SPG4 contient une au moins des mutations correspondant a un 
polymorphisme naturel chez I'Homme ou identifies par une methode selon la 
revendication 9 ou 10. 

21. Utilisation d'une sequence d'acide nucleique selon Tune des 
revendications 4, 5 et 12 comme sonde ou amorce, pour la detection et/ou 
('amplification de sequences d'acide nucleique. 

22. Utilisation d'une sequence d'acide nucleique selon Tun des 
revendications 1 a 6, et 12, pourle criblage de banque genomique ou d'ADNc. 

23. Utilisation d'une sequence d'acide nucleique selon I'une des 
revendications 1 a 3, et 12, pour la production d'un polypeptide recombinant ou 
synthetique. 
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24. Methode de production d'un polypeptide recombinant, caracterisee n 
ce que Ton cultive une cellule transformee selon la revendication 18 dans des 
conditions permettant I'expression dudit polypeptide recombinant et que Ton recupere 
led it polypeptide recombinant. 
5 25. Polypeptide, caracterise en ce qu'il est obtenu par une methode selon la 

revendication 24, 

26. Anticorps mono- ou polyclonaux ou leurs fragments, anticorps 
chimeriques ou immunoconjugues, caracterises en ce qu'ils sont capabl s de 
reconnaitre specifiquement un polypeptide selon Tune des revendications 13 a 15, et 

10 25. 

27. Methode pour la detection et/ou la purification d'un polypeptid selon 
I'une des revendications 13 a 15, et 25, caracterisee en ce qu'elle met en oeuvre un 
anticorps selon la revendication 26. 

28. Methode de diagnostic genotypique de la PSF-AD associee au gene 
15 SPG4, caracterisee en ce que Ton met en oeuvre une sequence d'acide nucleique 

selon I'une des revendications 1 a 6, et 12. 

29. Methode de diagnostic genotypique de PSF-AD associee a la presence 
d'au moins une mutation sur une sequence du gene SPG4 a partir d'un prelevement 
biologique d'un patient, caracterisee en ce qu'elle comporte les etapes suivantes : 

20 a) le cas echeant, isolement de PADN genomique a partir de Techantillon biologique a 

analyser, ou obtention d'ADNc a partir de f'ARN de I'echantiilon biologique ; 
b) amplification specifique de ladite sequence d'ADN du gene SPG4 susceptible de 

contenir une mutation a I'aide d 'amorces selon I'une des revendications 4 et 5 ou 

d'un acide nucleique selon la revendication 12 ; 
25 c) analyse des produits d'amplification obtenus et comparaison de leur sequence avec 

la sequence normale correspondante du gene SPG4. 

30. Methode de diagnostic de la PSF-AD associee a une expression 
anormale d'un polypeptide code par le gene SPG4, caracterisee en ce que Ton met en 
contact un ou des anticorps selon la revendication 26 avec le materiel biologique a 

30 tester, dans des conditions permettant la formation eventuelle de complexes 
immunologiques specifiques entre ledit polypeptide et le ou lesdits anticorps, et en ce 
que Ton detecte et/ou quantifie les complexes immunologiques eventuellement formes. 

31. Methode de selection d'un compose chimique ou biochimiqu capable 
d'interagir directement ou indirectement avec un polypeptide selon Tune des 

35 revendications 13 a 15, et 25, ou avec un acide nucleique selon Tune des 




nuus we** 

revendications 1 a 6, et 12, et/ou permettant de moduler I'expression ou I'activite de 
ces polypeptides, caracterisee en ce qu'elle comprend la mise en contact d'une 
sequence d'acide nucleique selon Tune des revendications 1 a 6, et 12, d'un 
polypeptide selon Tune des revendications 13 a 15, et 25, d'un vecteur selon Tune des 

5 revendications 16 et 17, d'une cellule selon la revendication 18, d'un mammifere selon 
Tune des revendications 19 et 20 ou d'un anticorps selon la revendication 26, avec un 
compose candidal et, la detection d'une modification de I'activite dudit polypeptide. 

32. Utilisation d'une sequence d'acide nucleique selon Tune des 
revendications 1 a 6, et 12, d'un polypeptide selon I'une des revendications 13 a 15, et 

10 25, d'un vecteur selon I'une des revendications 16 et 17, d'une cellule selon la 
revendication 18, d'un mammifere selon i'une des revendications 19 et 20 ou d'un 
anticorps selon la revendication 26, pour f'etude de {'expression ou de I'activite du gene 
SPG4. 
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REVENDICATIONS 

1 . Acide nucleique purifie ou isole du gene SPG4, caracterise en ce qu'il 
comprend au moins 15 nucleotides consecutifs d'une sequence choisie parmi le 

5 groupe comprenant la sequence SEQ ID No. 1, les sequences nucleiques homologu s 
ou variantes de I'acide nucleique de sequence SEQ ID No. 1, leur sequence 
complementaire et la sequence de leur ARN correspondant. 

2. Acide nucleique purifie ou isole selon la revendication 1, caracterise n 
ce qu'il comprend une sequence choisie parmi le groupe comprenant la sequence SEQ 

10 ID No. 1, la sequence SEQ ID No. 2, la sequence SEQ ID No. 72, les sequences 
nucleiques homologues ou variantes des sequences SEQ ID No. 1, SEQ ID No. 2 ou 
SEQ ID No. 72, leur sequence complementaire et la sequence de leur ARN 
correspondant. 

3. Acide nucleique purifie ou isole selon la revendication 1 ou 2, 
15 caracterise en ce qu'il comprend une mutation correspondant a un polymorphisme 

natural chez I'Homme. 

4. Sonde ou amorce, caracterisee en ce qu'elle comprend une sequence 
d'un acide nucleique selon Tune des revendications 1 a 3. 

5. Sonde ou amorce selon la revendication 4, caracterisee en ce que sa 
20 sequence est choisie parmi les sequences SEQ ID No. 4 a SEQ ID No. 71. 

6. Site accepteur ou donneur d'epissage, caracterise en ce qu'il comprend 
une sequence d'un acide nucleique selon la revendication 1 choisie parmi I s 
sequences SEQ ID No. 74 a SEQ ID No. 105. 

7. Methode pour le criblage de banques d'ADNc ou d'ADN genomique ou 
25 pour le clonage d'ADNc ou genomique isole codant pour la spastin, caracterisee en ce 

qu'elle met en oeuvre une sequence nucleique selon Tune des revendications 1 a 6. 

8. Methode selon la revendication 7, pour I'identification de la sequence 
genomique ou de I'ADNc du gene SPG4 de mammifere, notamment de souris. 

9. Methode pour I'identification de mutation portee par le gen SPG4 
30 humain, caracterisee en ce qu'elle met en oeuvre une sequence nucleique selon Tune 

des revendications 1 a 6. 

10. Methode selon la revendication 9, pour r identification de mutation 
responsable de la pa rap leg ie spastique familiale autosomique dominante. 

11. Methode pour I'identification des sequences d'acide nucleique 
35 promotrices et/ou regulatrices de I'expression du gen SPG4, caracterisee en ce 

qu'elle met en oeuvre une sequence nucl'ique selon Tune des revendications 1 a 6. 
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(gCTCCHXSAG ACCGGCGGGCACACGGGGGTCTGTGGO:CCCGCCGTAGCAGTGGCTGCCGCCGTCGCTTGGTTC 9 5 

I TTATGGOTGCGGCGGCAGTGAGAGCTGTGAATGAATTCTCCGGGTGGAC^ 1 90 
1 HNSPGGPGKKKGSGGASKPVPP 

CAGGCCTCCGCCCCCTTGCCTGGCtZCCCGCCCCTC^ 285 

23 RPPPPCLAPAPPAAGPAPPPESPHKRNI.YYFS 

CCTACCCGCTGTTTGTAGGeTTCGCGC^ 3 80 
55 Y P LFVG FAL L R LVAFH L G LIiFVW LC Q R F S R A 

CTCATGGCAGCCAAGAGGAGCTC(^G^CCGCGCCAG« 4 75 
86 LMAAKRSSGAAPAP ASASAPAPVPGGEAERVR 

AGTCTTCCACAAACAGGCCTTCGAGTACATCTCCATTGCCCTGCGCATC^ 570 
118 VFHKQAFETISIALRIDED EKA2GQKEQAVEWY 

ATAAGAAAGGTATTGAAG AACTGGAAAAAGGAATAGCTGTTATAGTTACAGGACAAqGTGAACAGTCT 665 
150 KKG I EELEKG I AVIVTGQG3EQCERARR t* Q A K 

atgatgactaatttcgttatggccaaggaccgctcacaactc 760 
181 hmtnlvhakdrlqlle4kmq pvlpfs ksqtdy y 

taatgacagtactaacttggcatgccgcaatggacatctcc^ 855 
213 ndsthlacrnghlqse5sgavpkrkdplthtsn 

attcactgcctcgttcaaaaacagttatgaaaactggatctgcaggcctttcaggccaccat^ 950 
245 slprsktvmktgsag lsghhrapsysglsmv 

tctggagtgaaacagggatctggtcctgctcctaccactcataag|ktactccg 1045 
276 sgvkqgsgpaptthkgtftpkthrtnkpstptta 

tactcgtaagaaaaaagacttgaagaattttaggaatgtggacagcaacctt^ 114 0 

308 trkkkdlknfrnvdshlanlimkeivdhg7tav 

ttaaatttgatgatatagctggtcaagacttggcaaaacaagcattgcaagaaattc 123 5 

340 kfddiag qdlakqalqeivilp5lrpel8ftg 

cttagag^tcctgccagagggctgrtactctttggtccacci^^ 1330 
371 lraparg lllf gpp ghgkt mla9kavaaes nat 

cttctttaatataagtgctgcaagtttaactt<^aaatacfergggagaag^ 1425 
403 ffnisaasltsky v10g egeklvral.favar e l q 

aaccttctataatttttatag^tgaagttgatagccttttgtgtc 1520 
435 p s i i f i due vdsllcerregehdasrr lktef 

ctaatagaatttcatggtptacagtctgctggagatgacagagtacttgtaatc 1615 
466 l i e f d g v12q s a g d d r vl.vmgathrpqei*peavl 

cagfccgtttcatcaaacgggtatatgtgtctttaccaaatgaggagjlcaaga 1710 
496 _r13r fikrvyvslpnee t14r llllknllckqg s pl 

tgaccxy^aaaagaactagcac^uvcttgctag^vatgactgatggatactcaggaagtgacct 1805 
530 tqkelaqlar mist dgysgsdltalakdaalgp 

atccgagJwctaaaaccagaacaggtgaagaa ta tgtctgccagtcag|^tcagaaatattcgattatctgacttc 1900 
561 i r e1«l kpeqvknhsase ml 7 r hirlsdfteslkki 

aaaacgcagcgtcagccctcaaactttagaagcgtacatacgttggaac^ 1995 
593 krsvspqtleayirwnkdfgdttv* 

tgcag aac atttt acttaaaagagg aaacacaag atcttc aatg aacgtcatcggct ac ag aaacagcctaagtttacagg acttttt agagtct 2090 

tacatatttgtgcaccaaacttgaagatcaaccagaaaacagactt 2185 

cttcatggtcacagttat<x!caatggacactaagttagagca<^ 2280 

aatttgtatattgtgttgc^gatgaaagtattccaggaacagtg 2375 

TT'AAAATAGTAATTTCTCCTACTTTTCTTTTCTACTGTTGTC 2470 

GTTTTATAAATTCAGTGTGCCAAATG AAACTTTTTTCCT AAGT 2565 

GACATTAAACAATTGTTGTGTTCTTTTTACCTTTTATTTTTCTATT^ 2660 

TATGGTAAAATAGAGAAGGTTTGAAGGTTTGAGTTACTCTGTC^ 2755 

GTATTTGTCAGAAATCTGTTGTAGACTGTTAACTTCr^^ 2850 

ACTGCTGTCAAAATGTTTCX^GTGCAAGAG AAGGG AAAT ACT AGG AACT^ 2945 

TAATTATAAGCAAGTGGAACTACCATCTTTTATTCTTAATAATTATTAATCCCT^ 3040 

ACATTTTTCTAGTTCCTTCTGCTTGCTTTATTAACTCAAAAG 3135 

TCCAT7TGTTTGTATAAATATGCCTGGATTTTCATTA 3230 
AAGGCAAATAGATATTTGCCCTTAGTTTACTGG 3263 
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tLCBBHRDHACAYVSYCKVLBBMKKBBAABDMMCLCPLTCABACSWHCLYI^ 

MTSFRBVKLBVI8CMRKRPEXCBBBDDLYPFT 
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MEAAEIC - - 
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BKEEBBBIKI--LEAI0Q0MSDI.SVrBST89BKBV88aEBVPC8CIQflLPITAPALFSLPPPPLI.»VDBASSTCALKPBflLETSTTMD8SKIBHP 

AAKBSfl -------- - -GAAFAFA8A8APAPVPCGEABBVRVPBKQAFEYIS IALBIDEDBKACOKEQAVEWXKKe XEELEKC - - 
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MHHWQRYARGAPR --SLTSLS FGKASBISTVKP - VLBSXMPVBQBLQTLSGLATB - HTIBR--S 

-MLLLSflSBIATKVVBBPVJlFBSYYGLTBIFSLHTOYfiLLHBLOEHKSGHKHEDHHEDAKLHKBIPTDEEVEAIHKOVEKYIEQTKHHTIPAHWK 

KAVLLLLLBALRRGPGPGFH PLUG PG PAHS -PGFFARPGRGBP YHASBPPGD — LAEAGGBALQ S 

HHVSKILVSPTVTTH VLBIFAPBLPQIGASLLVQKKWA LBSKKFYBF YSEKHSG EHPP K 

--KHSPGGBGKKKGSGGASH PVPPBPPPPCLAPAPPAAGPAPPP ESPHKRHLYYFS YPLFVGFALLRLVAFBLGLLFVWLC 

TQIBSFBISWTBLH EHBPHKE GEGKHHGHKDRHSHKEDGKDKBHEFGSLS E YFBSKEFAHTMFLTI G FT 1 1 F 

EQKBKIDESIBRLEDAVLKOESHHIQEEBKEKEEEHGPSKAKSHBTKEQGYFEGHHSBHIPPPPPPPPPKPPLHDPSHPVSKHVHLFQIGLTrFL 

LQLRLLTFTFEGIHGLLLKQH- - LVQHPVRLWQLLGGTF YFNTSBLKQKHKEKDKSKGKAPEEDE EEBRBB EBDDQMYBEBLBTLLV 

KEADSS6XASNKST ISSIDNSQP- -PPP8HTHDKTKQAHVAVSBAMLATBEQEA NXDLTSFDAQAAF YKLLLQSHT 

QRFSKALMAAKRSSGAAFAP ASASAPAPVP-GGEAEBVBVFHKQAFEYISIALHIDEDEKAG QKEQAVBWYKKG I EELEKG IAV 
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I (...) 459 

1 AGGCCGAGAGCGTCCGCGTCTTCCACAAGCAGGCCTTCGAGTACATCTCCATTGCCCTGC 60 
llllllll I I f I I I I llllllfllil lit IIIIIIIIIIIIIIIIIIIIHIIIIII 

4 60 AGGCCGAGCGCGTCCGAGTCTTCCACAAACAGGCCTTCGAGTACATCTCCATTGCCCTGC 519 
61 CCATCGACGAGGAAGAGAAAGCAGGACAGAAGGAACAAGCTGTGGAATGGTATAAGAAAG 120 

mini mi i iiiniiMiiniiiif ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 u 1 1 1 1 

520 GCATCGATGAGGATGAGAAAGCAGGACAGAAGGAGCAAGCTGTGGAATGGTATAAGAAAG 579 
121 GTATCGAAGAACTGGAAAAAGGAATCGCTGTTATAGTTACGGGCCAAGGTGAACAGTATG 180 

mi imim iiiiiiiiiiii iiiiiiiiiiiiii ii i ii 1 1 1 1 1 1 1 1 1 1 ii 

580 G T ATTG AAGA ACTGG AAAAAGG AAT AGCTGTT AT AGTT AC AGG ACAAGG TG AACAGTG TG 639 
181 AAAGAGCTAGACGTCTTCAAGCCAAAATGATGACTAATTTAGTTATGGCCAAGGACCGTT 240 

IIIIIIIIIIIII llllllll IMIIIIMIMIMII llllllll lllllllll I 

640 AAAGAGCTAGACGCCTTCAAGCTAAAATGATGACTAATTTGGTTATGGCCAAGGACCGCT 699 
241 TACAACTTCTAGAGAAGCTGCAACCAGTTTTGCAATTTTCCAAGTCACAGACGGACGTCT 300 

lllllllllllllllll lllllltllllllll I I I f I II I I I 1 1 | f I I I I I I I I | | | 
700 TACAACTTCTAGAGAAGATGXaVACCAGTTTTG<XATTTTCCAJW3TCACAAACGGACGTCT 759 
301 A T AACG AG AGT ACT AACCTG AC ATGCCGC AATGG ACATCTCCAGTCAGA AAGTGG AGC AG 360 

I IM II lllllllll II I 1 1 1 1 1 1 1 I f I 1 1 1 1 1 1 1 1 1 | 1 1 I ■ f 1 1 1 1 I 1 1 1 1 1 1 | 
760 ATAATGACAGTACTAACTTGiGCATGCCGCAATGGACATCTCCAGTCAGAAAGTGGAGCTG 819 
361 TTCCGAAGAGGAAAGACO:CTTAACACATGCTAGTAATTCATTGCCTCGATCAAAAACTG 420 

in i N ii iiiiiiiiiiiiiiiii 1 1 1 1 1 1 1 1 1 f i i r 1 1 1 1 1 iiiiiiii i 

820 TTCCAAAAAGAAAAGACCCCTTAACACACACTAGTAATTCACTGCX^IXXJTTOVAAAACJVG 879 
421 TCCTG AAAAG TGGCT(X:GCAGGGCTCTCCGGTCACCACAGGGCG<X^rAGTTGCAGTGGTT 480 

I llllll Ml II Mill M If II Mill M M 1 1 1 J 1 1 1 (If Mill 

880 TT ATG AAAACTGG ATCTGCAGG<XrTTTCAGGCCAC^TAGAGCACCT AG TT ACAGTGGTT 939 
481 TGTCCATGGTTTCTGGAGCAAGACCGGGACCTGGTCCTGCAG^ 540 

I MIIMIIMMIIM I II (III 1 1 1 f 1 1 1 1 ■ ■ 1 1 1 1 1 1 1 1 1 f I « f 1 1 1 1 

940 TATC<^TGGTTTCTGGAGTGAAACAGGGATCTGGTCCTG^ICCTAC<yWTCATAAGGGTA 999 
541 CTCCAAAACCAAATAGAACCAACAAACCTTCTACTCCCACAACTGCAGTTCGGAAAAAGA 600 

MM Ml IMMM II II MIMIIMII II llllllll Ml II M I 

1000 CTCOJAAAACAAATAGGACAAATAAACCTTCTACCCCTACAACTGCTACTCGTAAGAAAA 1059 
601 AAGACTTGAAAAATTTTAGGAATGTGGACAGCAATCrTGCTAACCTTATAATGAATGAAA 660 

IIMMMM 1 1 1 1 1 1 J 1 1 1 1 1 1 f f f I f I T 1 1 1 1 1 f 1 1 1 1 1 J 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1060 AAGACTTGAAGAATTTTAGGAATGTGGACAGCAACCTTGCTAACCTTATAATGAATGAAA 1119 
661 TTGTTGACAATGGGACAGCTGTTAAGTTTGATGACATAGCCGGGCAGGAGCTGGCAAAGC 720 

MM (MM II I II 1 1 1 1 II III llllllll Mill 1 1 M M MIMM I 

1120 TTGTGGACAATGGAACAGCTGTTAAATTTGATGATATAGCTGGTCAAGACTTGGCAAAAC 1179 
721 AAGCGCTGCAGGAGATTGTGATCCTTCCTTCTCTGCGGCCTGAGTTGTT 780 

MM MM II Mill II IIIIIIIIIIII f I f 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | 

1180 AAGCATTGCAAGAAATTGTTATTCTTCCTTCTCTCAGGCCTGAGTTGT^ 1239 
781 GAGCTCCTGCTAGAGGCTTGTTACTCTTCGGTCCCiCCAGGAAACGGAJUlAACAATGCTGG 84 0 

IIMMMM (MM II If If llll Mill M II II II II 1 1 1 1 1 1 1 1 1 1 

1240 GAGCTCCTGCCAGAGGGCTGTTACTCTTTGGTC^^CCTGGGAATGGGAAGACAATGCTGG 1299 
841 CTAAAGCAGTAGCTGCAGAGTCTAATGCGACCTTTTTCAACATAAGTGCTGOCAGTTTAA 900 

MUM llllllll II (MM (MM M II 1 1 1 1 1 1 1 1 1 1 1 IIIIIM 

1300 CTAAAGCAGTAGCTGCAGAATCGAATGCAACCTrCTTTAATATAAGTGCTGCAAGTTTAA 1359 
901 CTTCAAAATATGTGGGAGAAGGAGAGAAATTGGTGAGAGCTCTCTTTGCTGTGGCTCGAG 960 

IIMMMM tlllllllllllf IIIIIIIIIIIII Mill MIIIIMIMIIMI 

1360 CTTCAAAATACGTGGGAGAAGGAGAGAAATTGGTGAGGGCTCTTTTTGCTGTGGCTCGAG 1419 
961 AACTTCAACCATCTATAATTTTTATAGATGAAGTTGACAGTCTTTTGTGTGAGAGACGGG 1020 

IIMMMM 1 1 1 1 1 1 II I II II 1 1 1 1 1 1 1 1 1 1 II I II I M Mill II I III I I 

1420 AACTTCAACCTTCTATAATTTTTATAGATGAAGTTGATAGCCTTTTGTGTGAAAGAAGAG 1479 
1021 AAGGGGAGCACGACGCTAGCAGACGGCTAAAGACGGAATTTTTAATAGAATTTGACGGGG 1080 

IIIIIIIIIIIII Mill Mill Mill II (Mill IIIIIIIIIIIII II I 

1480 AAGG«JAGCACGATG«TAGTAGACGCGTAAAAACTGAATTTCTAATAGAATTTGATGGTG 1539 
1081 TGCAATCTGCTGGAGATGACAGAGTACTTGTAATGGCTGCAACTAACAG 1140 

I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II M I IIIIIM 

1540 TACAGTCTGCTGGAGATGACAGAGTACTTGTAATGGGTGCAACTAATAGGCCACAAGAGC 1S99 
1141 TTGATGAAGCTGTTCTCAGGCGTTTCATTAAACIGGGTATATGTGTCCTTACCAAATGAGG 1200 

IMMM 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 f * 1 1 1 lllllllllllllllll IIIIIIIIIIIII 

1600 TTGATGAGGCTGTTCTCAGGCGTTTCATCAAACGGGTATATGTGTCTTTACCAAATGAGG 1659 
1201 AGACAAGACTCCTTCTGCTTAAAAACCTGTTGTGTAAACAAGGAAGTCCACTGACCCA 1260 

IIMMMM III MMIMMI (MM I II 1 1 1 1 1 1 M II I M 1 1 lllllllll 

1660 AGACAAGACTACTTTTGCTTAAAAATCTGTTATGTAAACAAGGAAGTCCATTGACCCAAA 1719 
1261 AAGAACTCGCACAGCl^GCTAGAATGACQJATGGATACTCTG^AAGTGATCTGACCGCTT 1320 

IMMM Mill (IIIIIIIIIIIII IIIIIIIIIH MIMMI II II MM 

1720 AAGAACTAGCACAACTTGCTAGAATGACTGATGGATACTCAGGAAGTGAOCTAACAGCTT 1779 
1321 TGG(XAAGGATG£AG/CCCTGGG^CCTATCCGAGAACTGAAGCCAGAG£AGGTGAAGAATA 1380 

llll II llllllll 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II Mill MMMIMMM 

1780 TGGCAAAAGATG<^GCACTGGGTCCTATCCGAGAACTAAAACCAGAAC^ 1839 
1381 TGTCTGCX!AGTGAGATGAGAAATATTCGATTATCTGACTTCAC^GAATCCTTAAAAAAGA 1440 

I II MMMI 1 1 II II I II I M I (MMMM I II III M I II MIMMI Mill I 

1840 TGTCTGCC AGTG AG ATG AG AAA T ATTCG A TT ATCTG ACT TC ACTGAATC CT TG AAAAA AA 1899 
1441 TAAAACGCAGTGTGAGTCCTCAGACCTTAGAAGCATACATACGCTGGAACAAGGATTTTG 1500 

IIMMMM II M IMM II llllllll llllllll 1 1 1 1 1 1 1 1 1 1 1 Mil 

1900 TAAAA<^GCAGCOTCAG<XCTCAAACTTTAGAAGCGTAC 1959 
1501 G AG AC ACCACTGTTT A A AGG AAT 1523 

MM IIIIIIIIIIII I III 

I960 G AG AT ACCACTGTTT AAGGAAAT 1982 
1983 (...) 3263 

1524 G GATGCCTCTGTG AGCCCAT AG AACATCGCACTTCAC AGG AAAC AAG AGCTTTGGCT ACA 1583 
1584 GGAACCCAGACTTCGTTTACAGGACGTTTTAGAGTTTTCATTTTTGTGC ACCAAACTTGA 1643 
164 4 AG AGGAAC AAG AAG ACAG ACCT AAA TAAAAT ATGCAAT A TG AATGG 1689 
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